Openai sospetta che i modelli di AI Deepseek della Cina, significativamente più economici delle controparti occidentali, siano stati sviluppati utilizzando i dati di Openai. Questa rivelazione, unita al rapido successo di Deepseek, ha scatenato una recessione del mercato per le principali società di intelligenza artificiale, con Nvidia che ha subito le perdite più sostanziali nella storia di Wall Street.
Il modello R1 di DeepSeek, basato sull'apertura open source Deepseek-V3, vanta costi di allenamento significativamente più bassi (stimati a $ 6 milioni) e requisiti di potenza di calcolo rispetto ai modelli occidentali come Chatgpt. Sebbene questa affermazione sia discussa, ha alimentato le preoccupazioni degli investitori in merito agli enormi investimenti in AI da parte dei giganti della tecnologia americana. La popolarità di Deepseek è aumentata nei grafici delle app statunitensi in mezzo alla controversia.
Openai e Microsoft stanno studiando se DeepSeek abbia violato i termini di servizio di Openi impiegando "distillazione", una tecnica che estrae i dati da modelli più grandi, per formare i propri modelli utilizzando l'API di Openi. Openai ha confermato la sua consapevolezza di tali tentativi da parte di società cinesi e di altre società e ha messo in evidenza le sue misure proattive per proteggere la sua proprietà intellettuale, compresa la collaborazione con il governo degli Stati Uniti.
David Sacks, consulente di intelligenza artificiale del presidente Trump, ha confermato il sospetto di estrazione dei dati dai modelli OpenAI, prevedendo ulteriori azioni da parte delle principali società di intelligenza artificiale per prevenire tali pratiche.
La situazione mette in evidenza una significativa ironia: Openai, accusata di utilizzare contenuti di Internet protetti da copyright per addestrare Chatgpt, sta ora accusando Deepseek di pratiche simili. Questa ipocrisia è stata ampiamente notata, in particolare alla luce della precedente dichiarazione di Openi alla House of Lords del Regno Unito secondo cui è impossibile addestrare i principali modelli di intelligenza artificiale senza materiale protetto da copyright. Questa affermazione segue le azioni legali intentate dal New York Times e 17 autori che sostengono l'uso illegale del loro lavoro. Openai sostiene che le sue pratiche di formazione costituiscono un "equo uso". Il dibattito sottolinea le complesse sfide legali ed etiche che circondano l'uso di materiale protetto da copyright nella formazione del modello AI.