Chargé De Projet Recherche En Apprentissage Et Traitement Automatique Des Langues (h/f)
Posted 67 days ago0 applicants
Company Description
View moreNous sommes l’Agence nationale de sécurité sanitaire de l’alimentation, de l’environnement et du travail.
Notre rôle ? Apporter les repères scientifiques utiles aux décideurs publics pour mieux protéger notre santé, celle des animaux celle des plantes et des écosystèmes.
Comment ? Par nos activités de recherche, de surveillance et d’évaluation des risques, et en faisant des recommandations aux pouvoir publics y compris en cas de crise sanitaire.
Nos principes d’actions :
• Approche globale des risques
• Excellence scientifique
• Transparence & indépendance
• Ouverture & dialogue avec la société
Job Description
L’Anses recrute
un Chargé de projet recherche en apprentissage et traitement automatique des langues (H/F)
Poste basé à Maisons-Alfort (94) - CDD de 12 mois
Vos missions
Vous participerez au projet de recherche SafeFood4ClimDiet coordonné par l’Anses, en collaboration avec l’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE). Ce projet a pour objectif d’identifier les risques microbiologiques associés aux nouvelles pratiques alimentaires influencées par le dérèglement climatique. Il vise en particulier à identifier les pratiques alimentaires par le développement de méthodes de traitement automatique des langues.
Vous aurez pour objectif de développer une méthode originale de reconnaissance d’entités nommées (NER) en français et en anglais, fonctionnant en zero-shot learning, c’est-à-dire sans nécessiter de données d’entraînement annotées manuellement. L’approche envisagée est de s’appuyer sur les grands modèles de langue (LLMs) en mode conversationnel (“hard prompting”), tirant parti des connaissances latentes qu’ils ont acquises lors de leur pré-entraînement sur de vastes corpus textuels. La méthode sera évaluée sur des jeux de données standard en reconnaissance d’entités (tels que NCBI Disease Corpus, FoodBase corpus), tout en étant optimisée pour identifier a minima deux types d’entités spécifiques : les concepts environnementaux (ex : "carbon footprint", "biodiversity loss", "environmental concern") et ceux en lien avec les comportements de consommation alimentaire (ex : noms d’aliments "apple", méthodes de production "organic food" ou encore relatives à des pratiques dites durables "composting food waste").
Votre équipe
A l’Anses, la Direction de l’évaluation des risques (DER) assure l’ensemble des missions d’évaluation dans le domaine des bénéfices et des risques nutritionnels et sanitaires liés à l’alimentation, des risques liés à la santé-environnement, des risques liés à la santé au travail, des risques liés à la santé, à l’alimentation et au bien-être des animaux, et des risques liés à la santé des végétaux. Au sein de cette direction, l’Unité « évaluation des risques liés aux aliments » (UERALIM) a pour mission principale la coordination des travaux de collectifs d’experts pour l’évaluation des risques sanitaires liés à la présence de contaminants biologiques ou chimiques dans les aliments, sous la responsabilité d’un chef d’unité et d’un adjoint. Elle contribue à la communication scientifique des produits de l’expertise et présente l’activité scientifique de l’unité auprès des instances nationales ou communautaires. Elle collabore avec les autres directions et les laboratoires de l’Agence. Elle participe à des projets de recherche nationaux ou internationaux. Vous rejoindrez une équipe de 15 personnes.
Le projet de recherche implique une collaboration avec l’unité de recherche MaIAGE (« Mathématiques et Informatique Appliquées du Génome à l’Environnement ») de l’INRAE, située à Jouy-en-Josas (78) , qui développe des méthodes mathématiques et informatiques originales de portée générique ou motivées par des problèmes biologiques précis. L’équipe de recherche Bibliome développe des méthodes d’extraction d’information (text mining) à partir de textes, notamment dans les domaines des sciences du vivant (bioNLP).
Vos missions
Développer une méthode originale de reconnaissance d’entités basée sur des LLMs, fonctionnant en zero-shot learning
Mettre en place une évaluation rigoureuse en comparant la méthode aux approches de l’état de l’art sur des jeux de données standard de reconnaissance d’entités
Appliquer la méthode pour la détection des entités d’intérêt pour le projet, sur un corpus non-annoté en français et en anglais, pour proposer des tendances alimentaires émergentes à d’autres acteurs du projet ANR. Le corpus sera composé de documents en science de la vie et en science sociale (publications scientifiques, articles de journaux)
Analyser le corpus du projet : annotation manuelle de quelques documents, mise en place d’une méthode baseline de reconnaissance d’entité à des fins de comparaison, et analyse d’erreurs
Collaborer avec les autres chercheurs du projet (informaticiens, microbiologistes et sociologues) et contribuer aux livrables scientifiques
Votre profil
Formation et expérience requises :
BAC + 3 minimum
Doctorat en Informatique, en Traitement Automatique des Langues naturelles (TAL), Text-mining ou discipline connexe souhaité.
Une première expérience similaire à l’une ou plusieurs des missions décrites sera appréciée.
Compétences :
Maîtrise pratique des grands modèles de langue (LLMs) et utilisation par API
Maîtrise de la programmation Python
Expérience en évaluation de modèles
Capacité à travailler en mode projet, rigueur, organisation et planification
Maîtrise de l’anglais scientifique et technique (écrit et oral)
Expérience ou intérêt marqué pour la recherche interdisciplinaire, notamment avec les sciences du vivant (ex : sciences des aliments, microbiologie)
Connaissance des principes d’ingénierie des connaissances, et en particulier des ontologies, serait un plus
L’Anses recrute, accompagne et valorise les talents dans leur diversité pour s’engager au service de la santé publique.
Rejoignez-nous !

