Le huitième séminaire de l'IPT intitulé : L'Intelligence artificielle au profit de la recherche de molécules thérapeutiques contre les maladies infectieuses : La COVID-19 comme cas d'étude sera assuré par
Dr. Emna Harigua, Biologiste adjoint contractuel au Laboratoire d'Epidémiologie Moléculaire et de Pathologie Expérimentale
Il aura lieu le jeudi 29 septembre 2022 à 11h00 dans le Grand amphithéâtre de l'IPT.
Le séminaire sera retransmis en direct sur la page Youtube de l'IPT : https://www.youtube.com/watch?v=xGeyX8WC3v8
Résumé : La découverte de médicaments assistée par ordinateur, dite Computer-Aided Drug Discovery (CADD), a pris un essor grâce aux progrès récents dans le domaine de l'analyse des données et de l'intelligence artificielle (IA). Dans ce contexte, des ensembles de données fiables et disponibles pour la communauté sont de la plus haute importance pour être utilisés dans le développement de nouvelles approches en IA pour la découverte de nouvelles molécules thérapeutiques. Ces approches dites Ligand-based Drug Discovery (LBDD) reposent sur un ensemble de techniques allant de l'encodage des structures chimiques en empreintes moléculaires jusqu'aux algorithmes de Machine Learning (ML) et de Deep Learning (DL). Dans le cadre des travaux de CADD contre le SARS-CoV-2, nous avons effectué une recherche approfondie de la littérature et grâce à de multiples étapes de filtrage, nous avons intégré des informations sur 2,610 molécules ayant un effet validé contre le SARS-CoV et/ou le SARS-CoV-2. Les structures chimiques de ces molécules ont été encodées par de multiples systèmes afin d'être facilement utilisables comme données d'entrée pour des algorithmes d'apprentissage automatique (ML) classiques ou des architectures d'apprentissage profond (DL). Nous avons évalué les performances de sept algorithmes ML et de quatre algorithmes DL pour classer les molécules en deux catégories : actives et inactives. Les modèles présentant les meilleures performances ont été optimisés par réglage des hyperparamètres. Les scores ROC-AUC obtenus par validation croisée ont atteint les 85%, démontrant ainsi la capacité de ces algorithmes à correctement prédire les activités des molécules anti-coronavirus. Une étape de validation externe sur la collection de médicaments approuvés par la FDA a révélé un potentiel supérieur des algorithmes DL pour réaliser la reconversion de ces médicaments contre le SRAS-CoV-2 en se basant sur nos données. Une approche similaire a aussi été utilisée pour la recherche de molécules anti-Leishmania.
Biographie d'Emna Harigua : Emna Harigua est Bioinformaticienne et Data Scientist. Elle a un profil multidisciplinaire avec un diplôme d'ingénieur en "Chimie Analytique et Instrumentation" et un master en "Traitement de l'Information et Complexité du Vivant". Elle a par la suite fait sa thèse de doctorat à l'Institut Pasteur de Paris dans le domaine de la bioinformatique structurale appliquée au domaine de la recherche des molécules thérapeutiques, en collaboration avec le Laboratoire d'Epidémiologie Moléculaire et Pathologie Expérimentale (MEEP) à l'IPT. Dr. Harigua mène actuellement des travaux de recherches dans le domaine du Computer-Aided Drug Discovery où elle développe de nouvelles approches computationnelles et techniques de pointe en bioinformatique structurale et en intelligence artificielle (IA) pour aboutir à la découvertes de nouvelles molécules thérapeutiques contre les maladies infectieuses. Elle a levé plusieurs fonds pour conduire ces recherches, le plus récent étant le projet BIND, financé par l'African Academy of Sciences dans le cadre du programme ARISE. Depuis 2019, Dr. Harigua a élargi ses travaux dans le domaine de l'IA au diagnostic médical, et a lancé son projet de startup AI4HD visant à développer des outils de diagnostic digital et des systèmes de e-Health.