L'IA et la restructuration du marché du développement logiciel : preuves issues des écosystèmes open source

Institut Mines-Télécom Business School

Domaine scientifique Analyse de données & intelligence artificielle

Domaine scientifique Confiance numérique

IA générative

Logiciel libre

Collaboration

Productivité

Diversité technologique

Information pratique

Directeur de thèse

Vincent Lefrere 

Encadrants

Vincent Lefrere (HDR) & Maximilian Schaefer 
International Cooperation: MIT and Boston University

Potential business cooperation with the company Linagora
 

Laboratoire d’accueil

IMT-BS (Department Data Analytics, Economics and Finance), LITEM

Plus d'information

Description

Le développement de logiciels libres, pilier de l'innovation collective et de la production de biens communs numériques (Lerner & Tirole, 2000 ; Lakhani & von Hippel, 2003), connaît actuellement une transformation sans précédent sous l'impulsion de l'intelligence artificielle générative (genAI). Celle-ci remodèle profondément les pratiques de production de code et les incitations des contributeurs. Parallèlement, les contributions volontaires ont progressivement diminué, tandis que la participation des grands acteurs du numérique s'est intensifiée, comme en témoignent l'augmentation du nombre de contributeurs salariés, les modèles « open core » et les activités axées sur les services (Li et al., 2024). Si la participation des grandes entreprises apporte des ressources, des processus de travail professionnels et de la visibilité à la communauté open source, elle est également perçue comme un facteur potentiellement préjudiciable du point de vue des contributeurs indépendants, dont les motivations sont souvent dictées par des considérations non monétaires telles que l'altruisme, l'apprentissage, la reconnaissance, le plaisir ou le sentiment d'appartenance à une communauté, ce qui soulève des questions sur la gouvernance, l'orientation technologique et l'évolution des modes de collaboration (Bitzer et al., 2007 ; Meissonier et al., 2010 ; Zhang et al., 2024). L'objectif de cette thèse est d'examiner comment l'avènement de l'IA générative affecte plus largement le développement des logiciels open source, en mettant particulièrement l'accent sur son potentiel à recalibrer ou à perturber la dynamique délicate entre la participation indépendante et celle des entreprises à l'open source. Les travaux existants montrent que le codage assisté par l'IA peut augmenter la productivité et la qualité du code tout en recomposant les tâches (Hoffmann et al., 2024 ; Yeverechyahu et al., 2024 ; Cui et al., 2025 ; Peng et al., 2023), et que les communautés en ligne exposées à l'IA générative montrent des changements en termes de participation, de spécialisation et de qualité (Burtch et al., 2024 ; Quinn & Gutt, 2025). S'appuyant sur une collecte de données GitHub à grande échelle sur les référentiels, les contributeurs et les affiliations, le premier chapitre de la thèse mesure si les développeurs rémunérés et non rémunérés ont réagi différemment à la sortie de ChatGPT-3.5. Nous analysons comment l'IA générative interagit avec les motivations intrinsèques et les récompenses extrinsèques, et si les outils d'assistance ont un impact différent sur les routines professionnelles par rapport à l'exploration volontaire. Les prochaines étapes consisteront à étudier comment l'IA générative remodèle la nature des contributions, l'orientation des projets et la robustesse du code qui en résulte, afin d'identifier les groupes qui tirent parti des gains de productivité liés à l'IA et les implications pour l'écosystème open source. Sur le plan empirique, nous nous appuyons sur trois sources de données complémentaires. Un panel d'observations mensuelles des développeurs résumant le nombre de contributions par type (pushes, pull requests, issues, etc.). Ensuite, un corpus de descriptions de référentiels, qui nous permet de mener une analyse thématique afin d'évaluer les changements dans les fonctionnalités des projets open source. Enfin, nous utiliserons une base de données reliant les contributeurs et le code qu'ils produisent, ce qui nous permettra d'évaluer l'impact de l'IA générative sur la qualité du code et les mesures connexes documentées dans la littérature sur le génie logiciel (Yeti¸stiren et al., 2023).

Bibliographie

[1] Lerner J., Tirole J. (2000). The Simple Economics of Open Source. Journal of Industrial Economics., 52:197-234.

[2] Lakhani K., von Hippel E. (2003). How Open Source Software Works: “Free” User-to-User Assistance. Research Policy, 32(6):923-943.

[3] Li X., Zhang Y., Osborne C., Zhou M., Jin Z., Liu H. (2024). Systematic Literature Review of Commercial Participation in Open Source Software. ACM Transactions on Software Engineering and Methodology, 33(2):1-31.

[4] Bitzer J., Schrettl W., Schröder P. (2007). Intrinsic Motivation in Open Source Software Development. Journal of Comparative Economics, 35(1):160-169.

[5] Meissonier R., Bourdon I., Houze E., Amabile S., Boudrandi S. (2010). Comprendre les motivations des développeurs de l’open source à partir de leur participation. Systèmes d’Information et Management, 15(2):71-97.

[6] Zhang Y., Qin M., Stol K-J., Zhou M., Liu H. (2024). How Are Paid and Volunteer Open Source Developers Different? A Study of the Rust Project. ICSE 24: Proceedings of the IEEE/ACM 46th International Conference on Software Engineering., 195:1-13.

[7] Hoffmann M., Nagle F., Zhou Y. (2024). Generative AI and the Nature of Work. CESifo Working Paper No. 11479.

[8] Yeverechyahu Y., Mayaa R., Oestreicher-Singer G. (2024). The Impact of Large Language Models on Open-Source Innovation: Evidence from GitHub Copilot. SSRN.

[9] Cui K., Demirer M., Jaffe S., Musolff L., Peng S., Salz T. (2025). The Effects of Generative AI on High-Skilled Work: Evidence from Three Field Experiments with Software Developers. Working Paper. SSRN.

[10] Peng, S., Kalliamvakou, E., Cihon, P., Demirer, M. (2023). The Impact of AI on Developer Productivity: Evidence from GitHub Copilot. ArXiv., abs/2302.06590.

[11] Burtch G., Carnahan S., Chen Y. (2024). Generative AI Degrades Online Communities. Communcations of the ACM., 67(3):40-42.

[12] Quinn M., Gutt D. (2025). Generative AI and Participation Inequality in Online Collaboration. SSRN.

[13] Yeti¸stiren B., Özsoy I., Ayerdem M., & Tüzün E. (2023). Evaluating the Code Quality of AI-Assisted nCode Generation Tools: An Empirical Study on GitHub Copilot, Amazon CodeWhisperer, and Chat-GPT. arXiv preprint, abs/2304.10778.