Indice
- 1 Il repository dei preprint valuta sanzioni severe contro gli autori che caricano studi con citazioni false, istruzioni lasciate dai chatbot e segnali evidenti di mancata verifica
- 2 Che cos’è arXiv?
- 3 Perché arXiv interviene sui paper generati dall’IA?
- 4 L’intelligenza artificiale può essere usata per scrivere un paper?
- 5 Quali segnali rivelano un paper generato dall’IA?
- 6 Come si riconosce una citazione inventata dall’IA?
- 7 Come si controlla se un articolo online è generato dall’IA?
- 8 I detector di testi IA sono affidabili?
- 9 Che cosa cambia per ricercatori, giornalisti e lettori?
- 10 La stretta di arXiv fermerà i paper generati dall’IA?
Il repository dei preprint valuta sanzioni severe contro gli autori che caricano studi con citazioni false, istruzioni lasciate dai chatbot e segnali evidenti di mancata verifica
arXiv, uno dei più importanti archivi scientifici online al mondo per la pubblicazione di preprint, articoli di ricerca resi disponibili prima della revisione formale da parte di una rivista scientifica, sta alzando il livello di controllo sui paper prodotti o rifiniti con strumenti di intelligenza artificiale senza una reale verifica umana. La novità riguarda i casi più evidenti, cioè manoscritti che contengono riferimenti bibliografici inventati, frasi lasciate dal modello, istruzioni visibili nel testo o passaggi che mostrano una delega sostanziale del lavoro scientifico a un sistema generativo.
Secondo la linea indicata da Thomas Dietterich, presidente della sezione computer science di arXiv, prove chiare di mancato controllo potrebbero portare a un bando di un anno per gli autori. Al rientro, i nuovi lavori dovrebbero prima essere accettati da una sede peer-reviewed affidabile. La decisione punta a difendere la funzione originaria della piattaforma, nata per accelerare la circolazione della ricerca, evitando che la velocità diventi una scorciatoia per bozze prodotte automaticamente e firmate senza verifica.
Che cos’è arXiv?
arXiv, usato da ricercatori di tutto il mondo per pubblicare preprint, cioè versioni preliminari di articoli scientifici rese disponibili prima della pubblicazione formale su una rivista o in un convegno. È molto usato in fisica, matematica, informatica, statistica, astronomia, economia e in altri settori quantitativi.
Il valore di arXiv sta nella velocità. Un gruppo di ricerca può rendere pubblico un risultato prima dei tempi lunghi della pubblicazione tradizionale, ricevere osservazioni dalla comunità scientifica e fissare una priorità sul lavoro svolto. In molti ambiti, depositare un lavoro su arXiv è diventato un passaggio quasi ordinario della comunicazione scientifica.
La piattaforma applica una moderazione preliminare, diversa dalla peer review. I controlli servono a verificare pertinenza, forma e compatibilità minima con gli standard della comunità. La revisione tra pari resta un processo distinto. Per questo la fiducia nel sistema dei preprint dipende anche dalla serietà degli autori.
Perché arXiv interviene sui paper generati dall’IA?
arXiv interviene perché una parte crescente dei manoscritti mostra segni di uso disinvolto dell’IA, con testi caricati senza un controllo reale su fonti, citazioni e passaggi tecnici. Gli LLM scrivono testi fluidi e apparentemente solidi, ma proprio questa qualità superficiale può nascondere l’errore. Una bibliografia inventata, un metodo descritto in modo generico o una conclusione formulata con sicurezza rischiano di passare per contenuti scientifici credibili.
In un archivio scientifico il danno può essere rilevante. Un errore inserito in un preprint può essere letto da altri ricercatori, ripreso da un giornalista, citato da un secondo lavoro o indicizzato da motori accademici. Il rischio è che un errore scritto bene venga letto, ripreso e citato prima che qualcuno ne controlli davvero l’origine.
Uno studio recente pubblicato su arXiv ha analizzato 111 milioni di riferimenti bibliografici in 2,5 milioni di paper presenti in arXiv, bioRxiv, SSRN e PubMed Central, stimando in modo conservativo 146.932 citazioni allucinate nel solo 2025. Il dato mostra che le citazioni inventate sono ormai un problema concreto della produzione scientifica.

L’intelligenza artificiale può essere usata per scrivere un paper?
L’uso dell’IA resta possibile. La differenza passa dalla verifica. Correggere una frase con l’IA è diverso dal delegare al modello fonti, metodo e conclusioni. Un autore può servirsi di strumenti generativi per correggere refusi, migliorare la chiarezza, tradurre, organizzare una scaletta o rendere più leggibile una bozza.
Chi firma un paper risponde di dati, citazioni, metodo, risultati e conclusioni. Un chatbot può aiutare nella preparazione del testo, ma resta uno strumento. La responsabilità scientifica appartiene all’autore. L’abuso comincia quando il modello produce la sostanza del lavoro e la persona si limita a caricarlo, senza controllare davvero fonti e passaggi tecnici.
Quali segnali rivelano un paper generato dall’IA?
Il segnale più evidente è la presenza di frasi lasciate dal modello. Espressioni come “ecco una sintesi”, “vuoi che modifichi questa parte”, “inserisci qui i dati reali”, “questa tabella è illustrativa” o “come modello linguistico” indicano che il testo è passato da un sistema generativo ed è stato pubblicato senza una revisione finale accurata.
Ci sono poi indizi meno evidenti, ma utili per capire se il testo è stato costruito più sulla forma che sui contenuti. Un paper sospetto può avere bibliografie molto ordinate ma non verificabili, metodi descritti in modo vago, risultati presentati con eccessiva sicurezza, concetti ripetuti più volte e poche informazioni operative. La fluidità dello stile, da sola, non prova nulla. Diventa un campanello d’allarme quando copre povertà di dati, fonti fragili o ragionamenti circolari.

Come si riconosce una citazione inventata dall’IA?
Le citazioni false sono uno dei segnali più gravi. Possono sembrare vere perché contengono titolo, autori, rivista, anno e DOI. La verifica richiede pochi passaggi. Bisogna copiare il titolo esatto tra virgolette su Google Scholar, Crossref, PubMed, Semantic Scholar o sul sito della rivista. Poi vanno controllati DOI, autori, anno, volume, numero e pagine.
Se il titolo non esiste, se il DOI rimanda a un altro articolo, se la rivista non ha pubblicato quel lavoro o se gli autori risultano associati a studi diversi, la citazione diventa una prova forte di mancata verifica. Il problema va oltre l’errore formale. La scienza procede attraverso riferimenti controllabili. Una fonte inventata introduce nella letteratura un riferimento fantasma, che può essere ripreso e trasformato in una base apparentemente credibile.
Come si controlla se un articolo online è generato dall’IA?
Per un articolo divulgativo o giornalistico il controllo parte dalle fonti. Un testo affidabile permette di capire da dove arrivano dati, dichiarazioni, documenti e numeri. Un testo prodotto male con l’IA può essere molto leggibile, ma lascia spesso zone opache proprio nei punti in cui servirebbero prove.
Il lettore può fare tre verifiche rapide. La prima riguarda i nomi citati. Persone, università, enti, riviste e aziende devono esistere ed essere collegati al fatto raccontato. La seconda riguarda i numeri. Percentuali, date, campioni e risultati vanno cercati nella fonte primaria. La terza riguarda la coerenza interna. Un articolo sospetto può confondere Paesi, cambiare scala, attribuire a uno studio conclusioni più forti di quelle reali o presentare una ricerca preliminare come se fosse già un’applicazione disponibile.
I detector di testi IA sono affidabili?
I detector possono essere utili, ma offrono indicazioni probabilistiche. Un testo umano molto standardizzato può essere classificato come artificiale. Un testo generato dall’IA e poi rielaborato da una persona può risultare autentico. Lingua, settore, lunghezza e livello tecnico influenzano il risultato.
Il risultato di un detector va quindi trattato con cautela. Può suggerire un controllo più attento, ma non sostituisce la verifica delle fonti, dei dati e delle citazioni. Nel giornalismo, nella scuola, nell’editoria e nella ricerca scientifica, il controllo documentale resta più solido di qualsiasi responso automatico.
Che cosa cambia per ricercatori, giornalisti e lettori?
Per i ricercatori cambia il livello di attenzione richiesto. Ogni citazione va aperta, ogni dato va ricontrollato, ogni tabella va confrontata con il dataset originale, ogni affermazione tecnica deve essere riconducibile a un metodo, a un esperimento o a una fonte. La firma su un paper garantisce la verifica del contenuto, non solo la sua stesura.
Per i giornalisti la vicenda arXiv è un richiamo alla cautela. I preprint sono preziosi perché permettono di intercettare ricerche recenti, ma portano con sé un margine di incertezza. Prima di trasformare un paper in notizia occorre controllare lo stato della pubblicazione, la qualità della sede, la solidità dei dati, il ruolo degli autori e la coerenza con la letteratura precedente.
Per chi legge, il criterio resta pratico. Un testo affidabile permette di risalire alle fonti, controllare i numeri e capire da dove arrivano le affermazioni principali. Quando questi passaggi mancano, la buona scrittura non basta.
La stretta di arXiv fermerà i paper generati dall’IA?
La stretta di arXiv colpirà soprattutto i casi più evidenti, con citazioni inesistenti, istruzioni lasciate nel testo e segni chiari di un mancato controllo. I casi più raffinati resteranno difficili da individuare e sfuggiranno alle verifiche più attente.
La risposta, quindi, dovrà andare oltre la sanzione. Serviranno verifiche automatiche delle citazioni, controlli editoriali più strutturati, trasparenza sull’uso degli strumenti e una cultura più forte della responsabilità. L’IA può entrare nel lavoro scientifico come supporto. Un preprint, però, serve ad accelerare la conoscenza. Quando diventa una bozza firmata senza verifica, accelera soprattutto la diffusione dell’errore.
A cura della Redazione GTNews
Link utili:
arXiv.org e-Print archive
Content Moderation – arXiv info
Attention Authors: updated endorsement policy – arXiv blog
Attention Authors: Updated Practice for Review Articles and Position Papers in arXiv CS Category – arXiv blog
Come verificare un testo:
GPTZero
Copyleaks AI Detector
Originality.ai
Per verificare citazioni, DOI e fonti scientifiche
Google Scholar
Crossref Metadata Search
DOI.org
PubMed
Note per i lettori
L’immagine usata per questo articolo è stata creata grazie all’utilizzo di un sistema di Intelligenza Artificiale
