Open Data & Environnment

Challenge
Programme :  Epidemium Season 3
1/4
Acceptation des projets

Accélérer la recherche des facteurs d’exposition aux cancers par la structuration des Open Data.

1
Projet
0
Besoin
13
Membres

Open Data & Environnment

Qu'est-ce que le challenge Open Data & Environnement ?


La décennie 2010 a été l'occasion d'un formidable mouvement de libération de jeux de données ouverts. L'enjeu était alors la mise à disposition. Maintenant que de nombreux pays, dont la France au premier rang, ont mis en place des points d'accès nationaux à l'Open Data, l'enjeu en est l'exploitation. 


L'Open Data mis à disposition est une matière brute qui peut trouver une utilité dans plusieurs domaines, notamment en épidémiologie. Or, ces jeux de données, notamment avec une typologie géo-spatiale, peuvent ne pas répondre aux critères de format standard de l'Open Data (absence d'UUID, de mise à jour, liens cassés, etc), empêchant leur analyse dans de bonnes conditions. De plus, les outils de requêtes usuellement retrouvés sur les sites d’Open Data sont trop frustes pour permettre une bonne exploitation en raison des fonctionnalités minimales des moteurs de recherche.


Nous proposons aux challengers de produire une base de données épidémiologiques utiles aux chercheurs s'intéressant aux facteurs de risques oncologiques.


Découvrez à ce sujet l'interview de Bastien Rance et d'Hector Countouris de Géocancer 



Objectifs


  • Structurer les données ouvertes disponibles utiles et pertinentes pour la communauté scientifique à la recherche en épidémiologie des cancers :
  • en créant une ontologie orientée “épidémiologie du cancer”. Il est proposé de contribuer au projet Open Source Osiris, https://github.com/siric-osiris/OSIRIS
  • en développant des outils de requête (sur des portails proposant des catalogues d’ Open Data, généralement basés sur CKAN) et/ou de web-scrapping pour identifier les jeux de données sur la thématique « épidémiologie du cancer »


Les participants pourront illustrer l’intérêt de leurs outils par un cas d’usage concret, par exemple : extraire les déterminants environnementaux d’un cancer donné et les projeter sur une carte.


@datascientist les dataset et les précisions sur les input/output des modèles sont à venir



Résultats attendus


🗂 Une base ou un catalogue de bases de données utile à la recherche en oncologie reprenant les données environnementales pertinentes.

🔎 Approfondir les API développées par Etalab pour requêter les données et les pérenniser dans le temps.

📈 Construire la "datasets-viz" associée à une telle cartographie.

🔦 Illustrer l'intérêt de cette base de données par des exemples liés à l'épidémiologie des cancers



Sources des données


data.gouv. fr utilise :


Autres sources de données : 



_________________________________________________


Comment créer ou joindre un projet ?


Après avoir rejoins les pages "programme" et "challenge" :

  • Tu peux créer une équipe ici. Une fois ton équipe formée, crée un projet sur JOGL avec un nom percutant. N'oublie de mettre ta page "projet" régulièrement à jour en fonction de tes recherches, progrès et résultats.
  • Et/ou, s'il y a un projet déjà créé qui t'intéresse ou un besoin spécifique d'une équipe auquel tu peux répondre, tu peux rejoindre une équipe ici 


Ceci te donnera accès à tous les updates, des évènements aux équipes cherchant de l'aide.


*Les ressources (jeux de données, outils collaboratifs, etc...) seront disponibles le 9 septembre*



Quelles sont les guidelines d'un article scientifique ?



Pour être publié dans un journal scientifique, un article doit suivre des règles spécifiques. Ton résumé et ton poster devront suivre ces instructions :


  • Le résumé et le poster seront structurés sur le modèle d'un article scientifique :
  1. Introduction (contexte et problématique)
  2. Matériel et méthode
  3. Résultats
  4. Discussion
  5. Conclusion


  • Le résumé devra être accompagné de mots clés (5 maximum). 
  • Les documents devront être écrits en anglais.
  • Seul les résumés et les posters posté sur GitHub ou GitLab avant le 25 novembre seront évalués par les comités.


Pour en savoir plus sur le processus d'évaluation par les comités, rendez-vous sur la FAQs!



Rejoins la communauté et reste connecté !





Pour toutes autres questions, rendez-vous sur la FAQs!

Contact: contact@epidemium.org




ODD(s) abordés
3Bonne santé et bien-être
9Industrie, innovation et infrastucture
Compétences attendues
Open science
Lancement: 9 septembre 2021Fin des soumissions: 25 novembre 2021 (69 jours restant)

Dernières annonces

Loading spinner