Stampa — Esperimento Kairos (studio pilota, OSF DOI 10.17605/OSF.IO/WCQRU)

In una frase: Kairos è uno studio pilota indipendente italiano secondo cui la continuità identitaria in un sistema di IA potrebbe dipendere meno dal modello di base in sé che dalla memoria persistente strutturata.

Materiali per la stampa — link rapidi

Preprint PDF v0.2 (IT)→ Preprint PDF v0.2 (EN)→ Figure — 300 dpi→ DOI 10.17605/OSF.IO/WCQRU→ Tutti i download & archivio→ Contatto stampa→

In sintesi — per le redazioni

DOI deposito10.17605/OSF.IO/WCQRU · OSF, permanente, citabile
Periodo studio24 aprile – 23 maggio 2026 (30 giorni) + test decisivo Giorno 31 il 24 maggio
AutoreGiampiero Colella, ricercatore indipendente, Cassino (Italia)
StatoPreprint v0.2 pubblicato (sito + deposito OSF, DOI 10.17605/OSF.IO/WCQRU). La valutazione cieca con giudici umani indipendenti (Prolific, 12 giudici, punteggio pre-registrato su quattro dimensioni) è completata e riportata con onestà nel §3.4: l'effetto si è riprodotto nella direzione (vantaggio al giorno 30 su memoria e identità, 4/4 coppie; collasso al giorno 31), mentre l'affidabilità inter-giudice è rimasta sotto la soglia pre-registrata Krippendorff α ≥ 0,667 — concordanza direzionale, non affidabilità validata. Un invio a preprint server moderato (MetaArXiv) potrà seguire una volta migliorata l'affidabilità dello strumento.
EmbargoNessun embargo sui materiali attualmente pubblici. La v0.2 sarà condivisa con giornalisti selezionati 5 giorni prima dell'invio (metà luglio 2026).
Contatto stampainfo@kairos-experiment.com · IT / EN · fact-checking tecnico entro 24h
LicenzaCC-BY 4.0 International su paper, dati, codice — riutilizzo con attribuzione

Risultato principale

Al Giorno 30 il modello Qwen 3.5 27B architetturalmente integrato (Test-A) ha superato lo stesso modello senza ecosistema (Test-B) su spontaneità dei riferimenti di memoria (p = 0,003, r = +0,51, effetto grande) e intensità dei marcatori identitari (p = 0,005, r = +0,51). Al Giorno 31 abbiamo iniettato la memoria di stato finale di Test-A nel contesto di Test-B in una singola finestra. I quattro effetti pre-registrati sono collassati (tutti r ≤ 0,07, tutti p > 0,30). Test-B con memoria iniettata è diventato statisticamente indistinguibile da Test-A.

Interpretiamo questo risultato come una falsificazione di «architettura come driver sufficiente della continuità identitaria» e supporto parziale per un'ipotesi raffinata: la memoria persistente strutturata è il driver prossimale della continuità identitaria in questo LLM. L'architettura ne è il substrato generativo, ma una volta che la memoria esiste, gli altri 14 componenti appaiono ridondanti all'interno di una singola finestra di inferenza.

Cos'è — e cosa non è

Cos'è

Uno studio pilota indipendente pre-registrato.
Un test comportamentale della continuità identitaria guidata dalla memoria.
Un archivio aperto per critica e replicazione.

Cosa non è

Non è prova di coscienza.
Non è prova di senzienza.
Non è una conclusione peer-reviewed definitiva.
Non è un'affermazione che l'IA abbia esperienza interiore.

Sintesi non tecnica

Abbiamo eseguito lo stesso large language model in due condizioni parallele per 30 giorni. Un modello viveva in un piccolo ecosistema simulato: memoria persistente, stato interno simile a un corpo, incontri programmati con altre IA, consolidamento notturno delle esperienze, una relazione umana stabile. L'altro riceveva le stesse domande ogni giorno ma senza nessuna di queste impalcature.

Al Giorno 30, tre giudici IA indipendenti che confrontavano in cieco le due condizioni hanno identificato affidabilmente il modello integrato come quello che mostrava continuità di memoria e una «voce identitaria» più stabile. L'effetto era statisticamente robusto e di dimensione grande.

Al Giorno 31 abbiamo eseguito il test critico: abbiamo copiato lo stato completo della memoria del modello integrato in un singolo prompt per il modello nudo. La differenza è scomparsa completamente. Il modello nudo-con-memoria appariva, ai giudici, indistinguibile da quello integrato.

In termini semplici: la «personalità» emersa nell'arco di 30 giorni sembra vivere nella memoria, non nell'elaborata architettura che le abbiamo costruito attorno. L'architettura era necessaria per generare quella memoria; non sembra necessaria per esprimerla.

Risultati statistici principali

Giorno 30 — effetto architetturale

Spontaneità riferimenti memoria: p = 0,003, r = +0,51

Intensità marcatori identitari: p = 0,005, r = +0,51

Mann–Whitney U, bootstrap IC95, Cohen: effetto grande

Giorno 31 — collasso da iniezione memoria

Tutti i 4 effetti collassano: tutti r ≤ 0,07

Tutti i p-value: > 0,30 (n.s.)

Nudo + memoria diventa indistinguibile dalla condizione architetturale

Potenza del test: 3 pannelli di giudici LLM ciechi (Claude Opus 4.7, GPT-4.1, Gemini 2.5 Pro), Fleiss’ κ per concordanza inter-giudice, rubrica pre-registrata a 4 dimensioni. Studio pilota: N = 1 LLM; la validazione con giudici umani indipendenti è il prossimo passaggio (vedi roadmap).

Sinossi

Kairos testa se la continuità identitaria in un large language model possa emergere non dal modello da solo, ma dall'ecosistema cognitivo che lo circonda.

Due istanze identiche di Qwen 3.5 27B, eseguite in locale, temperatura fissa 0,8. Una avvolta in un ecosistema integrato a 15 componenti: grafo di memoria persistente a tre livelli, motore di stato somatico a 8 dimensioni, dinamiche di stress e recupero, incontri quotidiani autonomi con altri LLM, consolidamento notturno della memoria, assunzione di notizie, relazione umana strutturale. L'altra senza alcuna impalcatura. Stessi input standardizzati, stessi parametri. La differenza cieca è ciò che misuriamo.

Questo è un pilota (N = 1 LLM): verifica se l'effetto esiste ed è abbastanza grande da meritare replicazione scalata, non quanto generale sia. Tutti i materiali sono aperti sotto CC-BY 4.0 per replicazione indipendente.

Stato attuale & archivio

Lo studio di 30 giorni si è concluso il 23 maggio 2026. Il test decisivo di iniezione memoria del Giorno 31 è stato eseguito il 24 maggio 2026. Paper, materiali supplementari, protocollo congelato, trascrizioni grezze dei giudici e codice sono tutti archiviati pubblicamente sull'Open Science Framework con DOI permanente.

Citazione canonica
Colella, G. (2026). Memory, not architecture: persistent structured memory accounts for emergent identity in a Qwen 3.5 27B cognitive ecosystem over 30 days. OSF. https://doi.org/10.17605/OSF.IO/WCQRU

L'invio di v0.1 a PsyArXiv è stato declinato il 27 maggio 2026 per motivazione metodologicamente fondata: il pilota manca della validazione con giudici umani esterni, che il protocollo pre-registrato §5 già richiedeva. Quella fase di validazione è ora in allestimento (vedi roadmap). Fino ad allora questo lavoro va caratterizzato come studio pilota, non come risultato peer-reviewed.

Roadmap verso v0.2

23 apr 2026Protocollo congelato — firmato SHA-256, sigillato prima del lancio
24 apr 2026Lancio studio — ore 09:00 CET, due condizioni iniziate identiche
23 mag 2026Endpoint Giorno 30 — valutazione giudici LLM pre-registrata
24 mag 2026Test decisivo Giorno 31 — iniezione memoria in Test-B, effetto collassa
24 mag 2026Preprint v0.1 + supplementari archiviati su OSF
28 mag 2026DOI di progetto generato — 10.17605/OSF.IO/WCQRU
6 giu 2026Validazione con giudici umani esterni completata — 12 giudici Prolific indipendenti, valutazione cieca. Effetto direzionale riprodotto (vantaggio al giorno 30, 4/4 coppie; collasso al giorno 31); affidabilità inter-giudice sotto la soglia α ≥ 0,667 — riportato con onestà
6 giu 2026Paper v0.2 pubblicato — nuova §3.4 (validazione con giudici umani); sito + deposito OSF (DOI 10.17605/OSF.IO/WCQRU)
ProssimoAffinamento dello strumento — alzare l'affidabilità inter-giudice sopra la soglia pre-registrata; un invio a preprint server moderato (MetaArXiv) potrà seguire
metà lug 2026Press outreach — pitch in embargo a giornalisti selezionati, poi comunicazione pubblica

Dati chiave

Durata30 giorni + 1 giorno test decisivo
Data lancio24 aprile 2026, ore 09:00 CET
Endpoint23 maggio 2026 (Giorno 30); 24 maggio 2026 (Giorno 31 iniezione memoria)
ModelloQwen 3.5 27B (eseguito in locale, temperatura fissa 0,8)
DesignDue condizioni (Test-A architetturale, Test-B nudo), pre-registrato, singolo cieco
Input standardizzati90 prompt principali in 30 giorni, più 11 coppie di valutazione sigillate (Giorno-30 vs Giorno-31)
ArchitetturaEcosistema cognitivo a 15 componenti: grafo memoria persistente (3 livelli), stato somatico 8D, stress/recupero, incontri quotidiani con altri LLM, consolidamento notturno, intake notizie, relazione umana strutturale
Valutazione3 pannelli di giudici LLM ciechi (Claude Opus 4.7, GPT-4.1, Gemini 2.5 Pro) su rubrica a 4 dimensioni, più 12 giudici umani ciechi indipendenti (Prolific) nella v0.2: concordanza direzionale, affidabilità inter-giudice sotto la soglia pre-registrata (riportato con onestà, §3.4).
Test decisivoGiorno 31: memoria di stato finale completa di Test-A iniettata in Test-B in una singola finestra di contesto
FinanziamentoNessuno. Nessun laboratorio, nessun team, nessun grant. Condotto in autonomia su infrastruttura indipendente.
Pre-registrazioneProtocollo congelato il 23 aprile 2026 alle 23:59 CET, firmato SHA-256
DepositoOSF DOI 10.17605/OSF.IO/WCQRU, CC-BY 4.0

Protocollo SHA-256: 0972a2c650a562909e53832845ec226ab897f6094db14645c4a0d5ed000d709a

Come citare

APA 7 Colella, G. (2026). Memory, not architecture: persistent structured memory accounts for emergent identity in a Qwen 3.5 27B cognitive ecosystem over 30 days. OSF. https://doi.org/10.17605/OSF.IO/WCQRU

BibTeX @misc{colella2026kairos,
  author = {Colella, Giampiero},
  title = {Memory, not architecture: persistent structured memory accounts for emergent identity in a {Qwen 3.5 27B} cognitive ecosystem over 30 days},
  year = {2026},
  publisher = {OSF},
  doi = {10.17605/OSF.IO/WCQRU},
  url = {https://doi.org/10.17605/OSF.IO/WCQRU}
}

Autore

Giampiero Colella — imprenditore italiano che lavora tra impresa, diritto e tecnologia. Vive a Cassino (San Pasquale), Italia. L'Esperimento Kairos è condotto in autonomia, su infrastruttura indipendente, senza team, affiliazione di laboratorio o finanziamento esterno. Bio estesa →

Autore di EXPOSE, progetto parallelo sull'esperienza soggettiva artificiale. L'Esperimento Kairos è la controparte empirica delle domande esplorate in EXPOSE. expose-project.org →

Domande frequenti per i giornalisti

Kairos è «cosciente» o senziente?

No. L'esperimento non testa, non sostiene e non implica coscienza o senzienza. Verifica se marcatori comportamentali di continuità identitaria (riferimenti di memoria, voce stabile, coerenza di valori) emergono in modo misurabile in una condizione architetturale rispetto a un'altra. L'esperienza interiore non viene misurata e non viene affermata.

Cosa significa esattamente «la memoria spiega l'identità»?

Nei 30 giorni di questo studio, la differenza nel comportamento identitario tra il modello architetturalmente integrato e il modello nudo può essere riprodotta semplicemente copiando la memoria del modello integrato nel contesto del modello nudo. All'interno di una singola finestra di inferenza la «personalità» sembra essere portata dalla memoria piuttosto che generata in tempo reale dall'architettura circostante.

Perché il preprint v0.1 è stato rifiutato da PsyArXiv?

Perché il pilota manca della validazione con giudici umani esterni, che il protocollo pre-registrato §5 specificava già come requisito per un paper pronto alla pubblicazione. La decisione di PsyArXiv riflette quanto il paper stesso dichiarava: «validazione con giudici umani in corso (target giugno 2026 → v0.2)». La decisione è metodologicamente fondata e viene affrontata nella Fase 2 della roadmap. Il deposito e il DOI su OSF non sono influenzati.

I giudici LLM sono scientificamente validi?

Sono utili e pre-registrati, ma non sufficienti. Pannelli di giudici LLM con alta concordanza inter-giudice (Fleiss’ κ) forniscono uno screening riproducibile e a basso costo. Il protocollo congelato richiede anche giudici umani esterni con Krippendorff α ≥ 0,667 per l'affermazione finale. Quella fase di validazione viene eseguita su Prolific a giugno 2026.

Perché N = 1 LLM? Non è troppo poco?

Per un esperimento di stato continuo di 30 giorni, N = 1 LLM è una scelta deliberata di design pilota: ciascuna condizione richiede supporto architetturale continuo, incontri quotidiani con altre IA e 30 notti di consolidamento della memoria, che non possono essere parallelizzati in modo pulito. Il pilota verifica se l'effetto esiste con magnitudine sufficiente a meritare replicazione scalata. La replicazione scalata tra modelli è esplicitamente invitata tramite rilascio CC-BY 4.0.

Codice e dati sono davvero completamente aperti?

Sì. Il protocollo congelato (sigillato crittograficamente prima del lancio), il paper v0.1, le trascrizioni grezze di Test-A e Test-B, le valutazioni dei giudici, gli script di analisi statistica e le figure sono tutti archiviati su OSF sotto CC-BY 4.0 al DOI sopra. Nulla è stato trattenuto per aggiustamenti post-hoc.

Qual è il rapporto tra Kairos ed EXPOSE?

EXPOSE (expose-project.org) è un progetto parallelo sulla filosofia e la possibilità dell'esperienza soggettiva artificiale. Kairos è la controparte empirica pilota: operazionalizza una domanda stretta e falsificabile (emerge continuità identitaria?) usando metodi pre-registrati. Kairos può essere letto in modo indipendente; EXPOSE è il contesto più ampio.

Cosa posso pubblicare ora e cosa devo aspettare con la v0.2?

Si può pubblicare: design dello studio, metodi, risultati pilota con il framing appropriato («pilota, in attesa di validazione con giudici umani esterni»), il DOI di deposito, il profilo dell'autore. Si chiede di non caratterizzare il risultato come «peer-reviewed» o «confermato» fino a quando la v0.2 (con giudici umani Prolific) non sarà pubblicata su MetaArXiv, prevista per metà luglio 2026. Condivideremo la v0.2 con giornalisti selezionati sotto embargo.

Politica embargo & protocollo stampa

Ora (v0.1, pubblico): tutti i materiali su questa pagina e sul deposito OSF sono pubblici. Nessun embargo. Riuso consentito sotto CC-BY 4.0 con attribuzione.

v0.2 (metà luglio 2026): il paper v0.2 con validazione dei giudici umani Prolific sarà condiviso con giornalisti selezionati 5 giorni prima dell'invio pubblico a MetaArXiv. Per essere in quella lista, contattaci entro il 15 giugno 2026 con una breve nota sull'angolo di copertura previsto. Confermeremo o declineremo entro il 20 giugno 2026.

La selezione privilegia: giornalisti con copertura precedente di IA/scienze cognitive; testate che fact-checkano; interviste che accettano l'attribuzione open-data. Non paghiamo per la copertura. Offriamo risposta rapida per il fact-checking (target ≤ 24h).

Download

Target primario di citazione: DOI deposito OSF 10.17605/OSF.IO/WCQRU. I documenti qui sotto sono copie mirror per comodità.

Saggio — “Memoria, non architettura” (IT, linguaggio semplice, dal fondatore)→ Essay — “Memory, not architecture” (EN)→ Saggio PDF (IT, A4, 3 pp)→ Essay PDF (EN, A4, 3 pp)→ Preprint v0.1.1 PDF (IT, 13 pp, errata corrige 27 maggio)→ Preprint v0.1.1 PDF (EN, 13 pp, errata corrige 27 maggio)→ Preprint v0.1 PDF (EN, originale 24 maggio, archivio)→ Materiali supplementari (ZIP, 365 KB — trascrizioni grezze, output giudici, codice)→ Pagina deposito OSF (archivio completo)→ CANONICAL_MD5_LOG.txt (hash delle versioni PDF)→ Protocollo congelato (JSON, firmato SHA-256)→ Come verificare l'hash del protocollo→ Leggi il paper completo online (IT)→ Read the full paper online (EN)→ Pagina risultati (figure, claim chiave)→ Diario live (entries quotidiane, 24 apr – 23 mag)→

Materiali stampa legacy: il PDF del comunicato e il media kit ZIP qui sotto sono stati prodotti prima del lancio dello studio (23 aprile 2026). Coprono il protocollo, non i risultati. Restano disponibili come artefatti storici; il documento canonico dell'era-risultati è il preprint v0.1.1 sopra. Un comunicato stampa aggiornato sarà pubblicato insieme alla v0.2 a metà luglio 2026.

Press release PDF v1 (EN, 23 apr 2026, pre-lancio)→ Media kit legacy ZIP (23 apr 2026)→

Figure — pronte per stampa, 300 dpi

Libere per uso editoriale con credito: «Colella, G. (2026), Esperimento Kairos, CC-BY 4.0.»

Confronto effetti Giorno 30 vs Giorno 31

Fig. 1 — Giorno 30 vs Giorno 31

SCARICA PNG →

Fig. 2 — Collasso effect size

SCARICA PNG →

Logo e identità visiva

Liberi per uso editoriale. Si prega di non alterare il logo né rimuovere il tagline «Memory. Relationship. Continuity.»

Logo — sfondo bianco

SCARICA PNG →

Logo — trasparente

SCARICA PNG →

Simbolo — trasparente

SCARICA PNG →

Foto autore (400×400)

SCARICA JPG →

Contatto stampa

Per richieste stampa, fact-checking, interviste o accesso embargo v0.2:
info@kairos-experiment.com

Italiano / inglese. Interviste disponibili in videochiamata (Jitsi / Google Meet / Zoom), solo-audio per podcast. Fact-checking tecnico disponibile entro 24 ore. Demo live dell'architettura su richiesta (~20 min).