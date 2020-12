« Travaillant pour un projet de recherche sur le Covid, j'ai réalisé la difficulté d'accéder aux données liées au virus », a expliqué Emanuele Guidotti, assistant doctorant à l'Institut d'analyse financière de l'UniNE, fondateur de la plateforme avec David Ardia, professeur à HEC Montréal et ancien collaborateur de l'UniNE.

En cause, l'hétérogénéité des sources: en fonction des pays, les informations sont divulguées dans des langages et formats différents. Pour les unifier, l'assistant doctorant a développé le tout premier prototype de la plateforme au printemps.

« Ce travail faisait partie initialement d'un document de recherche qui a été publié par la suite dans Springer Nature et présenté sur le site web du Joint Research Centre », a précisé Emanuele Guidotti. Grâce à la collaboration de David Ardia, la plateforme a reçu des soutiens au Canada.





Sources officielles de 193 pays

A chaque heure qui passe, les algorithmes de Covid-19 Data Hub téléchargent automatiquement les données les plus récentes des sources officielles de 193 pays, de 500 régions et d'environ 4000 villes. « Une centaine de participants ont contribué à l'alimentation de la plateforme », a ajouté Emanuele Guidotti. Les données sont vérifiées puis fusionnées dans une seule base de données, accessible gratuitement à tout le monde dans n'importe quel format.

Le Covid-19 Data Hub va bientôt bénéficier du soutien financier du Consortium R, l'organisation mondiale qui promeut la croissance et le développement du logiciel R en tant que plateforme de premier plan pour la science des données et le calcul statistique. La maintenance du projet sera prise en charge par des professeurs du Département de statistique et de biostatistique de la California State University aux Etats-Unis, avec lesquels Emanuele Guidotti et David Ardia ont commencé à travailler. /ATS