Come DeepSeek ha riconfigurato la corsa all’intelligenza artificiale
L'arrivo dirompente dei modelli della startup cinese ha rimesso in discussione alcuni assunti tecnologici ed economici. Ma ha evidenziato il ruolo strategico dell'AI e la competizione tra Stati.
di Antonio Dini

È una delle innovazioni più sorprendenti e impressionanti che abbia mai visto”: le parole del venture capitalist Marc Andreessen sintetizzano alla perfezione lo stupore con cui la Silicon Valley ha assistito all’avvento di V3 e R1, i modelli di intelligenza artificiale creati da DeepSeek, la startup cinese derivata dall’hedge fund di Lian Wenfeng.
DeepSeek è riuscita a creare sistemi di AI potenti almeno quanto i principali realizzati negli Stati Uniti a una frazione del costo di training – 5,6 milioni di dollari per il suo modello V3, un LLM (modello linguistico di grandi dimensioni), contro gli oltre 100 milioni stimati per ChatGPT-4 – e utilizzando chip molto meno potenti e probabilmente in quantità inferiore (il numero di schede Nvidia utilizzate è ancora dibattuto), anche a causa dei blocchi commerciali imposti dagli Stati Uniti. DeepSeek è riuscita nell’impresa usando delle tecniche di programmazione e di funzionamento innovative e procedendo a ottimizzazioni sistematiche e su larga scala nel funzionamento dei sistemi di creazione e gestione dei modelli.
In questo ha giocato un ruolo significativo anche il fatto che DeepSeek abbia scelto un modello di sviluppo di tipo open source (pur con le differenze che questo ha nel settore dell’intelligenza artificiale rispetto all’ingegneria del software tradizionale, tanto che la definizione di open per questi modelli è contestata), da un lato potendo sfruttare l’aiuto di sviluppatori indipendenti di tutto il mondo, dall’altro aumentando la pervasività dei suoi modelli, perché possono essere scaricati da chiunque, nel repository presente su GitHub, e utilizzati in altro modo. I modelli possono quindi essere utilizzati in locale anche con computer relativamente poco potenti, mentre altre aziende possono riutilizzarli dopo averli portati nel proprio cloud. Microsoft stessa ha dichiarato di voler aggiungere i modelli di DeepSeek nell’offerta del suo cloud Azure (nonostante la partnership con OpenAI), mentre Perplexity offre R1 come opzione per il suo motore di ricerca.
Continua a leggere sul sito Guerredirete.it
Questa è la sezione Articoli della newsletter Guerre di Rete. Per iscriversi alla sezione bisogna prima essere iscritti alla newsletter Guerre di Rete (col bottone qua sotto).
L’iscrizione alla newsletter non iscrive automaticamente alla sezione Articoli, perché non vogliamo caricare gli iscritti di email non volute. Dunque se volete iscrivervi ANCHE alla sezione Articoli dovete andare sul vostro profilo Substack (in alto a destra), cliccare su Settings o Impostazioni, andare sulle newsletter cui siete iscritti, cliccare su Guerre di Rete e attivare le notifiche anche per la sezione Articoli.