Projet de fin de semestre du module Web Mining ,dans le master double diplome Exploration Informatique des Données et Decisionnels de l'Université Paris 13 et Web Intelligence et Science des Données de l'Université SIDI MOHAMED BEN ABDALLAH de Fés.
Trouver les sujets abordée par les marocains dans les medias sociaux (Facebook et Twitter) et les sites d'actualités marocaines entre Janvier 2018 et Janvier 2020
J'ai creer des robots d'explorations en utilisant Scrapy pour :
-Recuperer les publications de quelques pages facebooks populaires au Maroc comme Discovery Morocco :https://github.com/elreyfahad/morocco-media-crawler
-Recuperer les tweets du hastags #Maroc sur twitter : https://github.com/elreyfahad/twitterscraper
-Recuprer les resumés des articles de 3 journaux marocains populaires comme (bladi,hespress(version fr) et h24infos)
Aprés avoir scraper les données je les aggreger en fichiers csv,ou chaque document est representé par son text et sa date de publication,puis j'ai utilisée les techniques traditionnels de Text Mining pour nettoyer le texte de chaque documents.