1. Objectif
Développer un classifieur binaire distinguant la prise vaccinale.
2. Les étapes
Exploration du corpus de tweets
Annotation de messages pour la création d’un gold standard sur lequel sera entraîné le modèle
Choix des variables à intégrer dans le modèle, sélection de ces variables
Choix et entraînement d’un modèle, évaluation des performances via des mesures de pertinence (precision, recall, F1-score)
Application sur le corpus totalAnalyse des résultats: en global, selon le type de vaccin, ..
3.L'avancée
L'annotation a été répartie entre 10 personnes afin que ce soit fait plus rapidement.
D'un autre côté, une personne travaille sur "l'analyseur" afin de pouvoir analyser les récurrences dans les tweets du fichier donné.
Le travail effectué jusqu'à présent sera disponible sur le github suivant: https://github.com/dmadroszyk/regex_en_python
- Short Name: #VaxAdministrationOnSocialMedia
- Last update: April 17, 2020

