L'intelligenza artificiale sta rendendo il linguaggio giornalistico più ripetitivo e prevedibile. Questo è un problema per tutti

Articolo · Redazione · 28 maggio 2026

Cosa succede al linguaggio quando una quantità crescente di testi pubblicati sulla stampa, online e sui social media viene scritta da macchine? Questa domanda non è importante solo per la professione giornalistica, ma ha anche un impatto sulla ricchezza del linguaggio che tutti noi utilizziamo per comprendere, descrivere e discutere la realtà stessa.

Storicamente, la stampa è stata uno spazio in cui il linguaggio pubblico si è sviluppato e arricchito. Non è, ovviamente, l'unico motore del cambiamento linguistico, ma è uno degli ambiti in cui parole, espressioni e modi di descrivere i fatti nuovi o emergenti iniziano a circolare nella società.

Gli studi sul linguaggio giornalistico e sui neologismi dimostrano chiaramente che i giornali sono piattaforme per la creazione e la diffusione di nuovo vocabolario, soprattutto quando è necessario informare un vasto pubblico su eventi, tecnologie e cambiamenti sociali.

Tuttavia, se una quantità significativa di scrittura giornalistica viene delegata all'IA generativa, questo ruolo diminuirà. I modelli linguistici su larga scala ( LLM ) generalmente funzionano prevedendo il "token" o la parola successiva in una sequenza. Ciò consente loro di produrre testi fluidi e credibili, ma li porta anche a privilegiare la regolarità statistica, nonché argomentazioni e formulazioni comuni e consolidate.

Di per sé, questo non degrada il linguaggio. Il problema sorge quando questa logica arriva a dominare la scrittura nella sfera pubblica.

Il ciclo di feedback dell'IA

I rischi diventano seri quando i sistemi di intelligenza artificiale iniziano ad addestrarsi su testi già prodotti da altre IA. Questo porta a quello che diversi studi definiscono "collasso del modello" , un processo degenerativo per cui il materiale prodotto da un modello contamina i dati di addestramento delle generazioni successive.

In parole semplici, ciò significa che i sistemi di intelligenza artificiale imparano sempre di più dai testi sintetici. Se questi testi riempiono gli spazi pubblici, sia online che offline, l'ecosistema verbale per l'addestramento futuro risulterà molto più ristretto.

Un volume maggiore di testi artificiali implica un minor contatto con la variazione sociale intrinseca al linguaggio umano. Ciò potrebbe benissimo portare a un declino linguistico in molteplici ambiti.

Inoltre, rafforza i pregiudizi e le convinzioni preesistenti. Quando la variabilità dei dati diminuisce e prevalgono i modelli consolidati, i pregiudizi presenti nel materiale formativo possono essere rafforzati anziché corretti. La ricerca sull'evoluzione dei pregiudizi nei modelli di apprendimento online (LLM) avverte che i processi ricorsivi possono amplificare i pregiudizi esistenti anziché ampliare le prospettive.

Inoltre, la scrittura sta diventando sempre più ripetitiva e omogeneizzata . Ripete strutture sintattiche e tende a un tono neutro, a espressioni stereotipate e a strutture di paragrafo prevedibili. Questo è particolarmente importante nel giornalismo, perché la stampa non si limita a diffondere informazioni, ma funge anche da mediatore tra registri specialistici e più accessibili, decide dove porre l'accento, traduce il vocabolario e insegna forme di espressione.

Quando il linguaggio pubblico diventa troppo uniforme, si limita la capacità del giornalismo di affinare la scrittura in risposta a nuove informazioni.

Erosione dell'innovazione linguistica

Tutto ciò comporta una riduzione del numero di parole insolite o specialistiche, di costruzioni meno comuni e di sfumature pragmatiche – un termine che si riferisce a espedienti come l'ironia, l'ambiguità e la variazione dei punti di vista. L' uso crescente di testi sintetici nell'addestramento dell'IA è inoltre associato a un calo delle prestazioni e a una copertura più limitata della diversità del linguaggio umano. In parole semplici, il sistema preserva meglio il centro che le periferie .

Ma nel linguaggio, molte innovazioni iniziano come deviazioni erratiche, usi improbabili di parole o modi localizzati di denominare un nuovo fenomeno. Se il sistema privilegia sempre l'opzione statisticamente più probabile , significa che c'è meno spazio perché il linguaggio emergente circoli e si radichi.

Questo punto non va inteso come una dicotomia astratta tra uomo e macchina, bensì come una differenza concreta: tra il linguaggio, esposto agli eventi casuali della società umana, e la produzione testuale, derivata da regolarità apprese in precedenza.

Ecosistemi linguistici pubblici in fase di deterioramento

Non si tratta semplicemente di avere meno parole distinte, ma anche di una ridotta capacità di operare sottili distinzioni. Quando il linguaggio diventa più vago, prevedibile o ripetitivo, impoverisce anche gli strumenti che utilizziamo come società per descrivere i problemi, chiarire le opinioni e partecipare al dibattito pubblico.

A un livello più ampio, il problema non si limita a ciò che accade ai modelli di intelligenza artificiale addestrati su questi dati, ma riguarda anche l'ecosistema del linguaggio pubblico. Se internet si riempie di testi sintetici, lettori, giornalisti e istituzioni saranno tutti esposti a un linguaggio pubblico meno diversificato.

Alcune ricerche parlano anche di testi sintetici che "inquinano" l'ecosistema online, dimostrando che il modo in cui mescoliamo dati reali e dati artificiali è fondamentale per prevenire un ulteriore declino .

Non tutto è perduto

Detto questo, non dobbiamo lasciarci prendere dall'entusiasmo. La ricerca non dimostra che ogni utilizzo dell'IA porti invariabilmente al collasso o al declino. Alcuni studi dimostrano che quando i dati sintetici vengono mescolati con dati reali anziché sostituirli completamente, il collasso non si manifesta allo stesso modo e l'errore può essere contenuto.

In altre parole, il problema non risiede nell'uso occasionale dell'IA, o nella combinazione oculata di dati sintetici e umani. Il problema si presenta quando la scrittura umana viene sostituita in massa e quando tale sostituzione viene poi riutilizzata come se fosse una lingua viva.

Con l'integrazione dell'intelligenza artificiale nella vita professionale dei giornalisti, il giornalismo sta diventando più efficiente. Ma cosa perde una società quando il linguaggio che circola nella sfera pubblica diventa più uniforme e prevedibile, e meno aperto all'innovazione?

Se la stampa rinuncia, anche solo parzialmente, al suo ruolo di scrivere, tradurre, nominare e insegnare nuove lingue, ciò non influirà solo sulla giornata lavorativa dei giornalisti, ma indebolirà anche uno degli spazi in cui la lingua pubblica ha saputo arricchirsi, rinnovarsi ed espandersi maggiormente.

(Xosé López-García - Periodismo digitale, comunicazione digitale, Universidade de Santiago de Compostela -, Cristian Augusto Gonzalez Arias - Investigatore della Pontificia Universidad Catolica de Valparaiso; Università di Santiago de Compostela - su The Conversation del 27/05/2026)

ADUC è indipendente

Nessun finanziamento pubblico né pubblicità. Solo le donazioni ci rendono liberi.

Sostienici →

Preferenze cookie

Accedi ad ADUC

Cerca sul sito ADUC

L'intelligenza artificiale sta rendendo il linguaggio giornalistico più ripetitivo e prevedibile. Questo è un problema per tutti

In parole semplici, ciò significa che i sistemi di intelligenza artificiale imparano sempre di più dai testi sintetici. Se questi testi riempiono gli spazi pubblici, sia online che offline, l'ecosistema verbale per l'addestramento futuro risulterà molto più ristretto.