Ce projet s’inscrit dans le cadre du réseau lexical collaboratif « JeuxDeMots », développé au LIRMM, à Montpellier. Notre objectif principal consistait à développer un algorithme distribué sur la grille de calcul Grid5000, capable d’apprendre les liens sémantiques à partir de volumes importants de données.
Nous avons abordé plusieurs défis principaux :
- La maîtrise d’une table de données gigantesque dépassant 12 Go (des centaines de millions d’enregistrements).
- Assurer une répartition égale des informations afin d’optimiser la charge de travail.
- L’utilisation de frameworks comme Hadoop pour un calcul parallèle performant.
Ce projet a abouti à la création de deux algorithmes essentiels :
- Algorithme d’apprentissage : Assurant une distribution équitable et une mise en œuvre efficiente.
- Algorithme d’exploitation : En combinant et en regroupant les résultats pour une exploitation optimale.
Ce projet, initié sur la plateforme Grid5000, a servi de tremplin pour élaborer et perfectionner le réseau lexical « JeuxDeMots » et renforcer les fonctionnalités sémantiques.