Analyse de sentiments et sondage des commentaires

Transcription

Analyse de sentiments et sondage des commentaires
Analyse de sentiments et sondage des commentaires YouTube en Francais (Projet logiciel)
Encadrant:
Vincent Guigue ([email protected])
Détails:
Depuis quelques années, un domaine de recherche fait l'objet d'une attention particulière: l'analyse
de sentiments. De manière très générale, il s'agit de déterminer si le contenu textuel d'un document
est positif ou négatif. Ce type d'analyse ouvre donc la voie aux sondages automatiques sur le web
participatif et les réseaux sociaux ainsi qu'à la détection de buzz.
Le projet actuel consiste à analyser des commentaires YouTube pour sonder les avis sur différentes
marques de produits de beauté: il faudra donc séparer les commentaires positifs et les commentaires
négatifs tout en cherchant à quelle marque ils se rapportent.
1) Représentation d'un document textuel. Comme vous le verrez en parallèle dans l'UE TAL, les
textes sont souvent représentés en sacs de mots pour faciliter leur analyse. Nous verrons les outils
de la bibliothèque python sklearn permettant d'obtenir une telle représentation.
2) Construction d'un classifieur de sentiments francophone. Si les classifieurs de sentiments
anglophones sont de plus en plus courants, ce n'est pas le cas des outils en langue francaise. A partir
d'un corpus fourni, l'étudiant construira un tel classifieur en exploitant les outils python de la
librairie sklearn.
3) Divers approfondissements sont ensuite possibles et seront discutés avec l'étudiant: détection des
marques en utilisant des techniques d'analyse sémantique, crawling web pour l'amélioration des
ressources et du classifieur de sentiments, classifieurs de langue et traitement multilingues...
Support technique:
Les développements seront effectués en python: une connaissance a minima du langage est requise.

Documents pareils