Ciao,
sono Ivo Silvestro e questa è la 71ª edizione della mia newsletter settimanale di segnalazioni e riflessioni. Oggi parliamo di OpenAI e New York Times, di scie chimiche, di api che si estinguono (più o meno) e di caricabatterie che potrebbero andare sulla Luna.
Ma prima una foto: un paesaggio invernale in Val Bedretto.
Quer pasticciaccio brutto de OpenAI
Da una parte abbiamo il New York Times, che non è solo un quotidiano ma un importante e influente gruppo editoriale; dall’altra OpenAI, una organizzazione no-profit circondata da aziende decisamente orientate al profitto, e Microsoft. Come noto, il primo ha fatto causa ai secondi per violazione del copyright, concorrenza sleale e altro perché i contenuti del New York Times sono stati utilizzati per addestrare i modelli linguistici di OpenAI.
Possiamo pensarla come Davide contro Golia o al contrario come un novello Ned Ludd che reagisce agli sviluppi tecnologici distruggendo la tecnologia – nel caso di Ludd, i telai meccanici, nel caso del New York Times dei modelli linguistici che incorporano articoli del giornale.1
Entrambe le letture non mi convincono e qui voglio provare a mettere insieme un po’ di riflessioni che non si inseriscono in queste due narrazioni che comunque non sono del tutto campate per aria: sono convinto che il New York Times, e in generale il giornalismo indipendente, siano importanti e che certe funzioni di ChatGPT – che è ad esempio in grado di proporre integralmente articoli dietro paywall – ne mettano a rischio l’esistenza; d’altra parte i modelli linguistici e le intelligenze artificiali generative sono un importante sviluppo tecnologico che penso, forse ingenuamente, possa essere di beneficio per la società.
Iniziamo col dire che New York Times e OpenAI avevano cercato un accordo commerciale: la causa è la conseguenza del fallimento di queste trattative. O forse il loro proseguimento su un altro livello: non escludo che il procedimento si concluderà fuori dall’aula con un accordo – il che sarebbe un peccato, perché una sentenza metterebbe un po’ di ordine su vari problemi sollevati nella denuncia. E andrebbe a tutelare anche le testate che non hanno la forza del New York Times.
Tra i problemi che rimarrebbero senza risposta c’è sicuramente quello del copyright. Ora, io sarei anche favorevole a un profondo ripensamento della proprietà intellettuale che è roba escogitata quando si trattava di evitare che uno stampatore qualsiasi copiasse il Canto di Natale di Dickens2 e per sfruttare invenzioni come la macchina a vapore. Insomma, l’ideale sarebbe sedersi tutti intorno a un tavolo e chiedersi come avrebbe senso tutelare oggi le opere dell’ingegno – ma realisticamente questo è impossibile, per cui teniamoci il copyright così come è e cerchiamo di capire come applicarlo ai nuovi contesti. E mi pare di capire che la direzione nella si sta andando vede l’utilizzo per l’addestramento di modelli linguistici come un diritto patrimoniale3 e insomma il New York Times ha tutto il diritto di dire “se volete usare il nostro archivio pagate oppure non lo usate”. Anche perché OpenAI è una no-profit quanto ser Ciappelletto da Prato è un sant’uomo e infatti l’azienda potrebbe perdere il suo status – non sviluppa modelli linguistici a scopo di ricerca, cosa che dovrebbe esentarla dal diritto d’autore, ma per sfruttarli commercialmente.
Nella sua denuncia il New York Times ha presentato un lungo elenco di quelle che OpenAI – nella sua difesa – ha chiamato “regurgitation”, definendole un “raro difetto che vogliamo eliminare”. Le intelligenze artificiali generative dovrebbero essere, appunto, generative, cioè produrre materiale originale rielaborando le informazioni incorporate nella fase di addestramento. Tuttavia questa generazione è a volte una semplice riproposizione del materiale di partenza. Vedi questo esempio preso dalla causa: il testo in nero (cioè la prima riga) è stato riscritto da ChatGPT, quello in rosso è ripreso tale e quale dal New York Times.
Imbarazzante. Anche pensando a qualcuno che usa ChatGPT per fare ricerche e rischia di essere accusato di plagio.
Non ho le competenze tecniche per sapere se questo sia davvero un difetto eliminabile – il problema tuttavia sembra tutt’altro che raro e riguarda anche le immagini. C’è tuttavia anche il problema opposto, ovvero le allucinazioni, quando ChatGPT si inventa le cose. E può capitare che attribuiscano al New York Times cose mai scritte, danneggiandone la reputazione.
È difficile prevedere come finirà questa storia. Ho comunque l’impressione che il problema più importante che dovrà affrontare OpenAI, più che la denuncia del New York Times, sia riuscire a far fronte alle accuse mantenendo i propri prodotti utili e redditizi.
In poche parole
Fa caldo
Il 2023 è stato l’anno più caldo di sempre da quando registriamo le temperature: rispetto al periodo preindustriale abbiamo 1,48 °C in più – in pratica abbiamo già raggiunto, e senza che ci siano indizi di un cambio di rotta, quello che era considerato un po’ il limite massimo, quegli 1,5 °C in più che dovrebbero permetterci di gestire le conseguenze della crisi climatica.
Questo uno dei tanti grafici del progetto europeo Copernicus che ha “certificato” il record: mostra dal 1990 quanti giorni hanno registrato un’anomalia, sempre rispetto al periodo preindustriale, superiore a 1 °C.
Certo, ci sono le fluttuazioni annuali e verosimilmente il 2024 sarà un po’ meno caldo del 2023 ma la tendenza è chiara. Intanto la prossima conferenza delle parti sul clima, la COP29 che si terrà a novembre in uno stato, l’Azerbaijan, fortemente dipendente dai combustibili fossili, sarà presieduta da Mukhtar Babayev, anche lui proveniente dall’industria petrolifera.
Difficile essere ottimisti, ma credo sia importante evitare l’idea che non ci sia più niente da fare: anche se è praticamente certo che il limite di Parigi sarà raggiunto e superato, questo non vuol dire che tutto è perduto.
Scie climatiche
Immagino che tutti4 conoscano la bufala delle scie chimiche – l’idea che gli aerei rilascino apposta certe sostanze per ridurre la popolazione mondiale, modificare il clima o altro ancora – e che quelle che vediamo sono innocenti scie di condensazione. Ecco, in realtà non sono così innocenti, come scrive Aldo Piombino:5
Al di là dell’inquinamento atmosferico provocato dalle emissioni degli aerei, le scie di condensazione, oltre ad essere esteticamente discutibili, presentano alcuni problemi dal punto di vista climatico e di inquinamento (specialmente visivo), per le conseguenze sulle temperature della loro formazione. Potrà sembrare strano ma il totale di tutti gli effetti aeronautici è circa il 3,5% del totale antropogenico e l’impatto della somma degli effetti non legati alla CO2 è circa 2 volte più grande del riscaldamento indotto dalla CO2.
Sulla Luna con un caricabatterie
Lo smartphone che molto probabilmente state tenendo in mano per leggere questa newsletter ha maggiore potenza di calcolo del computer che ha permesso all’uomo6 di sbarcare sulla Luna. Cosa che tutto sommato non sorprende più di tanto, tenendo conto della quantità di cose che fa uno smartphone – quello che mi ha sorpreso è che molto probabilmente pure il caricabatterie dello smartphone è più potente dell’Apollo Guidance Computer. I dati nell’articolo, un po’ tecnico, Apollo 11 Guidance Computer (AGC) vs USB-C Chargers, dal quale prendo questa tabella:
In pochissime parole
La storia della Coca-Cola in Africa raccontata da Sara Byala su The Conversation – meno banale di quello che si potrebbe pensare: ad esempio nel Sudafrica dell’apartheid, l'azienda ha attuato una politica di disinvestimenti in modo da continuare a vendere le proprie bibite senza dare soldi al governo e anzi collaborando con l’African National Congress.
I fiori fanno meno sesso di un tempo. Come scrive il New York Times, visto che ci sono meno impollinatori in giro alcune specie puntano sulla riproduzione asessuata: si risparmia il nettare per gli insetti ma diminuisce la variabilità genetica il che è un rischio – altre specie per fortuna fanno il contrario, aumentano il nettare per attirare i pochi impollinatori rimasti. In fondo è la stessa cosa che si fa di fronte a una risorsa scarsa: o la si paga di più, o si cerca di farne a meno.
Sempre a proposito di impollinatori: non è che le api (domestiche) siano in via di estinzione o la loro scomparsa comporterebbe la fine dell’umanità; però gli impollinatori non se la passano benissimo, come scriveva l’amico Alfonso Lucifredi su Query online qualche anno fa.
C’è stato uno stupro nel Metaverso – e per quanto “limitata” al mondo digitale, è una violenza reale con la quale occorre fare i conti. Ne scrive Valeria Cecilia sul Foglio.7
A pagina 68 della denuncia si chiede davvero la distruzione “of all GPT or other LLM models and training sets that incorporate Times Works”. Il documento è disponibile sul sito del New York Times.
Si racconta che il Canto di Natale fu un grande successo commerciale dal quale però Dickens guadagnò pochissimo, perché la maggior parte delle copie vendute erano quelle che oggi definiremmo “pirata”. Peraltro questa è l’origine del copyright anglosassone: il diritto d’autore del diritto continentale ha un’altra storia legata al diritto di una persona di veder riconosciuto il proprio lavoro intellettuale.
Per i pignoli: sto usando la terminologia del diritto d’autore che, come accennato, è diversa da quella del copyright.
Almeno tra i lettori e le lettrici di questa newsletter. Anche se ho molti amici cospirazionisti.
Non sono riuscito a scrivere correttamente CO2, con il “2” in pedice. Chiedo perdono.
Di solito evito di usare “uomo” per intendere “essere umano” – ma in questo caso gli astronauti delle missioni Apollo erano tutti maschi.
Si può anche leggere qui: https://archive.is/mvkuZ.