OpenAI soupçonne que les modèles d'IA profonde de la Chine, nettement moins chers que les homologues occidentaux, ont été développés à l'aide des données d'OpenAI. Cette révélation, associée au succès rapide de Deepseek, a déclenché un ralentissement du marché pour les grandes sociétés d'IA, Nvidia subissant les pertes les plus substantielles de l'histoire de Wall Street.
Le modèle R1 de Deepseek, construit sur le open-source Deepseek-V3, possède des coûts de formation nettement inférieurs (estimés à 6 millions de dollars) et des besoins en puissance de calcul par rapport aux modèles occidentaux comme Chatgpt. Bien que cette réclamation soit débattue, elle a alimenté les préoccupations des investisseurs concernant les investissements massifs dans l'IA par les géants de la technologie américaine. La popularité de Deepseek a augmenté dans les palmarès des applications américaines au milieu de la controverse.
OpenAI et Microsoft examinent si Deepseek a violé les conditions d'utilisation d'Openai en utilisant la «distillation», une technique qui extrait les données de modèles plus grands, pour former ses propres modèles à l'aide de l'API d'Openai. OpenAI a confirmé sa conscience de ces tentatives de chinois et d'autres sociétés et a souligné ses mesures proactives pour protéger sa propriété intellectuelle, y compris la collaboration avec le gouvernement américain.
David Sacks, conseiller de l'IA du président Trump, a corroboré la suspicion d'extraction de données à partir de modèles OpenAI, prédisant d'autres actions en conduisant les sociétés d'IA pour empêcher de telles pratiques.
La situation met en évidence une ironie importante: Openai, lui-même accusé d'utiliser le contenu Internet protégé par le droit d'auteur pour former Chatgpt, accuse désormais profondément des pratiques similaires. Cette hypocrisie a été largement notée, en particulier à la lumière de la déclaration précédente d'Openai à la Chambre des Lords du Royaume-Uni que la formation des modèles d'IA à la conduite sans matériel protégé par le droit d'auteur est impossible. Cette déclaration fait suite à des poursuites déposées par le New York Times et 17 auteurs alléguant une utilisation illégale de leur travail. Openai soutient que ses pratiques de formation constituent une «utilisation équitable». Le débat souligne les défis juridiques et éthiques complexes entourant l'utilisation du matériel protégé par le droit d'auteur dans la formation des modèles d'IA.