PJE-A Plagiat VEMP

VEMP = Veïs, Eddy, Marc, Pape

PJE A - Master 1 Informatique - 2016-2017 - Université Lille 1

Contributeurs

Veïs Oudjail
Eddy El Khatib
Marc Baloup
Pape Badiane

Liens

https://gitlab-etu.fil.univ-lille1.fr/baloup/PJEA-Plagiat (intranet Lille 1 seulement)
https://github.com/marcbal/PJEA-Plagiat (dépôt privé)
http://ci.pandacube.fr/job/PJEA-Plagiat_dev (Intégration continue de la branche dev sur un serveur Jenkins)
http://ci.pandacube.fr/job/PJEA-Plagiat_dev/javadoc/index.html (Javadoc de la version dev actuelle)

Développement

Version de Java : 1.8

Utilise Maven pour la compilation et la génération de l'exécutable .jar.

Pour les utilisateurs d'Eclipse, la configuration du projet est déjà présente dans le dépot, notamment pour le formatage du code et l'activation des warning supplémentaires.

Évolution du projet

Premier rendu v1.0 du 6 octobre

Compare simplement les fichiers deux à deux, avec un algorithme simple. Une hiérarchie de classe permet facilement de switcher d'un algorithme à un autre juste en changeant la classe du comparateur appelé dans le main().

Algorithmes développés :

StrictEqualsFilesComparator : 100% quand les fichiers sont identiques (sauf commentaires et caractères non-imprimables), sinon 0% (le plus simple)
NaiveSuccessivesTokensFileComparator : Compare les fichiers tokens par tokens. Plus techniquement : divise le nombre de paire de tokens identique d'un fichier à l'autre par le nombre total de token du fichier qui en a le plus. Les tokens sont comparés dans l'ordre, donc l'ajout ou suppression d'une ligne de code au début d'un des fichier réduit drastiquement le pourcentage de similitude.

Deuxième rendu v2.0 du 20 octobre

Ajout d'une classe permettant la génération de l'empreinte du fichiers. Pour ce faire, les algorithmes utilisé pour le générateur sont :
- RabinHashCodeBuilder : Permet de creer les hashs suivant le formalisme de Rabin.
- WinnowingFootprintBuilder : Permet de creer les empreintes suivant de Winnowing avec les fenetres glissantes.

La comparaison effectué par le main est la suivante :

WinnowingAndAlignmentFileComparator : Comparaison de deux fichiers avec l'algorithmes d'alignement de Needleman-Wunsch. Le filtrage des fichiers trop différents (en comparant les empreintes) n'est pas implémenté

Troisième rendu v3.0 du 10 novembre

Fonctionnalités : On compare toujours les fichiers passé en argument du main, en utilisant l'algorithme d'alignement (en attendant la validation du test du Winnowing, et l'algo sur les fins de lignes)
Ajout d'un grand nombre de tests unitaires.
Développement (non terminé) d'algorithme de fusion de fichiers .java (pour tester la comparaison en gros volume)
Développement (non terminé) d'algorithme qui compare les fins de ligne des fichiers (caractères non-imprimables)
Installation du projet sur un serveur d'intégration Jenkins (lien au dessus) :
- Affichage graphique des tests unitaires Junit fonctionnels et non-fonctionnels
- Affichage de la couverture de code des tests unitaires (en relation avec un plugin Maven qui effectue l'analyse)
- Un build est lancé sur Jenkins à chaque push sur le dépôt Github.

Quatrième rendu v4.0 du 24 novembre

Fonctionnalités : On compare toujours les fichiers passé en argument du main, en utilisant l'algorithme d'alignement (en attendant la validation du test du Winnowing, et l'algo sur les fins de lignes). Ajout : Les déclarations de package et import ne sont pas pris en compte dans la comparaison.
Refactorign : réoraganisation générale de tous les packages et classes du projet. Code plus porpre dans pas mal de classes.
Développement Terminée de l'algorithme de fusion de fichiers .java. Des gros fichiers (provenant de projets Java sur Github) sont comparés dans nos classes de tests. Possibilité de fournir ces fichiers pour que les autres projets puissent être testés.
Amélioration de l'algorithme de comparaison des fins de ligne des fichiers (caractères non-imprimables)
Avancement des commentaires Javadoc du code source.

Rendu final v5.0 du 13 décembre

Fonctionnalités : Comparaison des fichiers deux à deux :
- Filtrage des fichiers : les import et package sont ignorés
- Application de l'algorithme de Winnowing : En dessous d'un certain pourcentage de ressemblance (entre les deux empruntes) le résultat de comparaison indique l'absence de plagiat, et termine (la suite n'est pas exécutée)
- Calcul du score d'alignement entre les deux fichiers, et division par le score maximum possible. On obtient un score entre 0 et 1. Au dessus d'un certain seil, le programme considère qu'il y a plagiat.
- Analyse et comparaison des espaces en fin de ligne des deux fichiers. Si une série de 5 fin de lignes consécutives sont identiques, le programme considère qu'il y a plagiat. Le score de comparaison des espaces est aussi une valeur entre 0 et 1.
- Le score global est calculé comme suit : min(1, scoreAlignement + (scoreFinLigne / 2.0))
- Le résultat final (plagiat ou pas) indique qu'il y a plagiat si au moins un des deux algos (alignement et fin de ligne) indique qu'il y a plagiat. Sinon, on laisse une incertitude.
Avancement des commentaires Javadoc du code source.
Les structures de données QGram et QGramContainer sont généralisés pour permettre de contenir autre chose que des tokens.

Name		Name	Last commit message	Last commit date
Latest commit History 220 Commits
.settings		.settings
grammars/java8		grammars/java8
src		src
tools		tools
.classpath		.classpath
.gitignore		.gitignore
.project		.project
AUTHORS		AUTHORS
Readme.md		Readme.md
TEAM		TEAM
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PJE-A Plagiat VEMP

Contributeurs

Liens

Développement

Évolution du projet

Premier rendu v1.0 du 6 octobre

Deuxième rendu v2.0 du 20 octobre

Troisième rendu v3.0 du 10 novembre

Quatrième rendu v4.0 du 24 novembre

Rendu final v5.0 du 13 décembre

About

Releases

Packages

Contributors 4

Languages

marcbal/PJEA-Plagiat

Folders and files

Latest commit

History

Repository files navigation

PJE-A Plagiat VEMP

Contributeurs

Liens

Développement

Évolution du projet

Premier rendu v1.0 du 6 octobre

Deuxième rendu v2.0 du 20 octobre

Troisième rendu v3.0 du 10 novembre

Quatrième rendu v4.0 du 24 novembre

Rendu final v5.0 du 13 décembre

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Languages

Packages