Génération de graphes de connaissances et fusion multimodale pour le raisonnement sur la collaboration : une approche hybride combinant réseaux neuronaux graphiques, modèles linguistiques et inférence logique

IMT Atlantique

Domaine scientifique Analyse de données & intelligence artificielle

Domaine scientifique Transformation durable des organisations

Graphes de connaissances

Raisonnement LLM

Réseaux de neurones type graphe

Inférence en langage naturel

Fusion multimodale

Information pratique

Directeur de thèse

Cécile Bothorel

Encadrants

Cotutelle entre Cécile Bothorel, professeure à IMT Atlantique, et Gregorio Robles, professeur à l'Universidad Rey Juan Carlos (EULiST)

Laboratoire d’accueil

Équipe Complex Networks, Pole DMID, Lab-STICC

Plus d'information

Description

Nous nous dirigeons vers un monde dans lequel le développement de logiciels reposera de plus en plus sur la collaboration d'agents IA. Ce projet constitue la première étape vers l'établissement d'une collaboration efficace entre les humains et les agents IA. En menant une analyse approfondie de la collaboration en ligne au sein de grandes communautés, nous proposons d'utiliser un graphe de connaissances et des capacités de raisonnement pour améliorer la gestion des tâches, la découverte d'expertise, l'intégration des connaissances et la transparence de la gouvernance au sein des écosystèmes de logiciels libres (OSS). Dans un avenir proche, lorsque l'IA et les humains développeront ensemble des systèmes logiciels, cela permettra d'intégrer la responsabilité humaine dans le processus de développement.

Les référentiels de logiciels open source (OSS) prospèrent en tant que communautés dynamiques et décentralisées où les développeurs construisent, affinent et diffusent collectivement leurs connaissances. Ils offrent de grandes quantités d'informations semi-structurées permettant de construire un graphe de connaissances (KG) qui capture la collaboration ; pour permettre un raisonnement avancé, il est nécessaire de fusionner les modalités disparates en une représentation unifiée. La manière d'encoder tous les types d'informations (réseaux de conversation (interactions dans les problèmes/PR), texte non structuré  (commentaires, descriptions), structure du code, flux de tâches , etc.) et la fusion de ces sources d'informations hétérogènes constituent le principal axe de recherche de notre projet. L'état de l'art s'appuie sur des cadres de fusion multimodale [Li & Tang, 2025]), notamment des architectures neuronales basées sur des graphes [Liu et al., 2020] [Liu et al., 2023] [Wu et al., 2021] et les LLM [Yang et al., 2024] pour obtenir des graphes de connaissances holistiques, informatifs et exploitables qui permettent un raisonnement avancé.

Nous proposons un cadre hybride qui intègre les réseaux neuronaux graphiques (GNN), les grands modèles linguistiques (LLM) et l'inférence en langage naturel (NLI) pour construire des graphes de connaissances multimodaux à partir de données OSS. Notre approche fait progresser le domaine grâce à : 1) des techniques de fusion novatrices pour les données hétérogènes sans réentraînement complet, en particulier via des techniques d'assemblage de modèles ou d'injection de connaissances, y compris l'utilisation d'ontologies existantes [Smith et al., 2011] [Nundlall & Nagowah, 2022], 2) des méthodes basées sur la NLI pour déduire les relations causales à partir des conversations des développeurs et des relations entre les problèmes en tant que flux de travail, 3) des architectures évolutives pour un déploiement dans le monde réel, 4) la publication d'un benchmark public pour la détection des doublons et les relations causales entre les problèmes et 5) une évaluation empirique des performances (précision, coût, robustesse) sur des ensembles de données publics et des cas industriels (utilisation d'un multi-agent basé sur LLM (LLM-MA) pour la résolution de problèmes complexes et la simulation du monde [Guo et al., 2024]).

Bibliographie

[dataset github, 2022] HuggingFace (2022). The Stack – GitHub issues dataset. https://huggingface.co/datasets/bigcode/the-stack-github-issues 

[Graphcodebert, 2020] Guo, D., Ren, S., Lu, S., Feng, Z., Tang, D., Liu, S., ... & Zhou,  M. (2020). Graphcodebert: Pre-training code representations with data  flow. arXiv preprint arXiv:2009.08366.

[Guo et al., 2024] Guo, Taicheng and Chen, Xiuying and Wang, Yaqi and Chang, Ruidi and Pei, Shichao and Chawla,Nitesh V. and Wiest, Olaf and Zhang, Xiangliang, Large Language Model Based Multi-agents: A Survey of Progress and Challenges, IJCAI24 (2024). https://doi.org/10.24963/ijcai.2024/890 

[Li & Tang, 2025] Li, S., & Tang, H. (2025). Multimodal alignment and fusion: A survey. arXiv preprint arXiv:2411.17040. Accepted to IJCV 2025, https://doi.org/10.48550/arXiv.2411.17040 

[Liu et al., 2020] Liu, J., Sui, D., Liu, K., & Zhao, J. (2020, December). Graph-based knowledge integration for question answering over dialogue. In Proceedings of the 28th International Conference on Computational Linguistics (pp. 2425-2435).

[Liu et al., 2023] Liu, Z., Wei, J., Li, R., & Zhou, J. (2023, October). SFusion: Self-attention based n-to-one multimodal fusion block. In International conference on medical image computing and computer-assisted intervention (pp. 159-169). Cham: Springer Nature Switzerland.

[Nundlall & Nagowah, 2022] Nundlall C, Nagowah SD. Task allocation and coordination process in distributed agile software development: an ontology based approach. Inf Technol Manag. 2022;23(3):167-192. https://doi.org/10.1007/s10799-022-00365-9. Epub 2022 May 10. PMID: 37521512; PMCID: PMC9086155.

[Smith et al., 2011] Smith, B. L., Tamma, V., & Wooldridge, M. (2011). An Ontology for Coordination. Applied Artificial Intelligence, 25(3), 235–265. https://doi.org/10.1080/08839514.2011.553376

[Wu et al., 2021] Z. Wu, S. Pan, F. Chen, G. Long, C. Zhang, and P. Yu. A Comprehensive Survey on Graph Neural Networks, IEEE Transactions on Neural Networks and Learning Systems, 32 (1): 4-24 (2021), https://doi.org/10.1109/TNNLS.2020.2978386 

[Yang et al., 2024] Yang, R., Yang, B., Feng, A., Ouyang, S., Blum, M., She, T., ... & Li, I. (2024). Graphusion: A rag framework for knowledge graph construction with a global perspective. arXiv preprint arXiv:2410.17600.

[Zhong et al., 2023] Lingfeng Zhong, Jia Wu, Qian Li, Hao Peng, and Xindong Wu. 2023. A Comprehensive Survey on Automatic Knowledge Graph Construction. ACM Comput. Surv. 56, 4, Article 94 (November 2023), 62 pages. https://doi.org/10.1145/3618295 

[Zhu et al., 2024] Zhu, Y., Wang, X., Chen, J., Qiao, S., Ou, Y., Yao, Y., ... & Zhang,  N. (2024). LLMs for knowledge graph construction and reasoning: Recent  capabilities and future opportunities. World Wide Web, 27(5), 58.

[Nundlall & Nagowah, 2022] Nundlall C, Nagowah SD. Task allocation and coordination process in distributed agile software development: an ontology based approach. Inf Technol Manag. 2022;23(3):167-192. https://doi.org/10.1007/s10799-022-00365-9. Epub 2022 May 10. PMID: 37521512; PMCID: PMC9086155.