L'IA et la restructuration du marché du développement logiciel : preuves issues des écosystèmes open source

Institut Mines-Télécom Business School

Plus d'information
Désolé... Ce formulaire est clos aux nouvelles soumissions.

Description

Le développement de logiciels libres, pilier de l'innovation collective et de la production de biens communs numériques (Lerner & Tirole, 2000 ; Lakhani & von Hippel, 2003), connaît actuellement une transformation sans précédent sous l'impulsion de l'intelligence artificielle générative (genAI). Celle-ci remodèle profondément les pratiques de production de code et les incitations des contributeurs. Parallèlement, les contributions volontaires ont progressivement diminué, tandis que la participation des grands acteurs du numérique s'est intensifiée, comme en témoignent l'augmentation du nombre de contributeurs salariés, les modèles « open core » et les activités axées sur les services (Li et al., 2024). Si la participation des grandes entreprises apporte des ressources, des processus de travail professionnels et de la visibilité à la communauté open source, elle est également perçue comme un facteur potentiellement préjudiciable du point de vue des contributeurs indépendants, dont les motivations sont souvent dictées par des considérations non monétaires telles que l'altruisme, l'apprentissage, la reconnaissance, le plaisir ou le sentiment d'appartenance à une communauté, ce qui soulève des questions sur la gouvernance, l'orientation technologique et l'évolution des modes de collaboration (Bitzer et al., 2007 ; Meissonier et al., 2010 ; Zhang et al., 2024). L'objectif de cette thèse est d'examiner comment l'avènement de l'IA générative affecte plus largement le développement des logiciels open source, en mettant particulièrement l'accent sur son potentiel à recalibrer ou à perturber la dynamique délicate entre la participation indépendante et celle des entreprises à l'open source. Les travaux existants montrent que le codage assisté par l'IA peut augmenter la productivité et la qualité du code tout en recomposant les tâches (Hoffmann et al., 2024 ; Yeverechyahu et al., 2024 ; Cui et al., 2025 ; Peng et al., 2023), et que les communautés en ligne exposées à l'IA générative montrent des changements en termes de participation, de spécialisation et de qualité (Burtch et al., 2024 ; Quinn & Gutt, 2025). S'appuyant sur une collecte de données GitHub à grande échelle sur les référentiels, les contributeurs et les affiliations, le premier chapitre de la thèse mesure si les développeurs rémunérés et non rémunérés ont réagi différemment à la sortie de ChatGPT-3.5. Nous analysons comment l'IA générative interagit avec les motivations intrinsèques et les récompenses extrinsèques, et si les outils d'assistance ont un impact différent sur les routines professionnelles par rapport à l'exploration volontaire. Les prochaines étapes consisteront à étudier comment l'IA générative remodèle la nature des contributions, l'orientation des projets et la robustesse du code qui en résulte, afin d'identifier les groupes qui tirent parti des gains de productivité liés à l'IA et les implications pour l'écosystème open source. Sur le plan empirique, nous nous appuyons sur trois sources de données complémentaires. Un panel d'observations mensuelles des développeurs résumant le nombre de contributions par type (pushes, pull requests, issues, etc.). Ensuite, un corpus de descriptions de référentiels, qui nous permet de mener une analyse thématique afin d'évaluer les changements dans les fonctionnalités des projets open source. Enfin, nous utiliserons une base de données reliant les contributeurs et le code qu'ils produisent, ce qui nous permettra d'évaluer l'impact de l'IA générative sur la qualité du code et les mesures connexes documentées dans la littérature sur le génie logiciel (Yeti¸stiren et al., 2023).