Assystem participe au challenge Kaggle: CORD-19

15 avril 2020

Assystem participe au challenge Kaggle COVID-19 Open Research Dataset (CORD-19) visant à développer des outils d'exploration de textes et de données afin d'aider la communauté médicale.

En réponse à la pandémie COVID-19, la Maison Blanche et une coalition de groupes de recherche de premier plan ont préparé une base de données de recherche ouverte COVID-19 appelée CORD-19. Cet ensemble de données, disponible gratuitement sur Kaggle, est fourni à la communauté mondiale des chercheurs. Un challenge est organisé pour développer des outils de data mining afin d'aider la communauté scientifique. Assystem a décidé d'y participer.

Ce défi organisé par Kaggle consiste à analyser un grand nombre de recherches et de données sur le COVID-19. Il aidera la communauté mondiale à mieux comprendre la maladie en utilisant des outils de science des données (PNL, exploration de données, etc.) qui peuvent aider la communauté scientifique à trouver des réponses sur des questions sanitaires qui sont prioritaires. 

Dans le cadre de ce challenge, l’équipe d’Assystem, composée de Paolo Minelli, Aleksei Iancheruk, Ali Kabbadj, Kien Trung Dang et Zakaria Bouhoun, cinq de nos experts en Natural Language Processing (NLP) et en data mining, a choisi de focaliser ses recherches sur les questions suivantes : Que savons-nous des facteurs de risque COVID-19 ? Qu'avons-nous appris des études épidémiologiques ?

L’objectif de l’équipe est de déterminer ce que l’ensemble des informations existantes nous apprend sur ce sujet :

  • Les données sur les facteurs de risque potentiels
  • La dynamique de transmission du virus, y compris le nombre de base de reproduction, la période d'incubation, l'intervalle de série, les modes de transmission et les facteurs environnementaux
  • La gravité de la maladie, y compris le risque de décès chez les patients hospitalisés symptomatiques et les groupes de patients à haut risque
  • La sensibilité des populations
  • Les mesures d'atténuation de la santé publique qui pourraient être efficaces pour le contrôle

Pour ce faire, notre équipe se prête à l’exploration de textes et de données via un traitement du langage naturel, de moteur de recherche et d’outils d'apprentissage automatique, déjà développés auparavant pour d'autres projets, ce qui leur permettra d’apporter une excellente réponse à ces questions.

« Nous avons estimé qu'il était important de participer à ce défi pour aider la communauté scientifique. Cela nous permet d'apporter notre expertise dans un contexte où la coopération mutuelle est plus nécessaire que jamais » exprime Paolo Minelli, Responsable Data Science chez Assystem.

A la clé du concours ? Kaggle parraine un prix de 1 000 $ par tâche au gagnant dont la soumission est identifiée comme répondant le mieux aux critères d'évaluation. Les gagnants peuvent choisir de recevoir ce prix sous forme de don aux efforts de secours/recherche de COVID-19 ou sous forme de paiement monétaire.

Dans le cadre de la lutte contre cette pandémie, Assystem s’emploie à mettre à profit son expertise digitale au service de la société et du secteur de la santé.

Plus d'informations sur le rapport de l'équipe ici: https://www.kaggle.com/alekseiiancheruk/assystem-covid-must-die-risk-factors-analysis

Pour en savoir plus sur Kaggle et son challenge, cliquez ici : https://www.kaggle.com/

Actualités connexes

01.12.2022

Assystem signe un protocole d’accord pour accompagner le premier programme nucléaire au Kazakhstan

Voir plus
28.11.2022

Assystem fait l'acquisition de LogiKal

Voir plus
24.11.2022

Assystem renforce son engagement dans la transition énergétique de l'Ouzbékistan

Voir plus