Kairos Experiment
Stampa · Media kit · Aggiornato 1 giugno 2026
v0.1 pilota · deposito OSF live · v0.2 in corso
Esperimento Kairos
La memoria come vettore della continuità identitaria
Studio pilota pre-registrato di 30 giorni su memoria, stato persistente
e identità emergente in un large language model Qwen 3.5 27B.
Ricerca indipendente, Cassino (Italia). Protocollo firmato
crittograficamente prima dell'inizio; dati grezzi, codice e trascrizioni
dei giudici archiviati pubblicamente per replicazione.
In una frase: Kairos è uno studio pilota indipendente italiano secondo cui la continuità identitaria in un sistema di IA potrebbe dipendere meno dal modello di base in sé che dalla memoria persistente strutturata.
Materiali per la stampa — link rapidi
In sintesi — per le redazioni
- DOI deposito
10.17605/OSF.IO/WCQRU · OSF, permanente, citabile
- Periodo studio24 aprile – 23 maggio 2026 (30 giorni) + test decisivo Giorno 31 il 24 maggio
- AutoreGiampiero Colella, ricercatore indipendente, Cassino (Italia)
- StatoPilota v0.1 archiviato pubblicamente. Validazione con giudici umani esterni in corso (target 7–14 giugno 2026). v0.2 con risultati completi sarà inviata a MetaArXiv entro metà luglio 2026.
- EmbargoNessun embargo sui materiali attualmente pubblici. La v0.2 sarà condivisa con giornalisti selezionati 5 giorni prima dell'invio (metà luglio 2026).
- Contatto stampainfo@kairos-experiment.com · IT / EN · fact-checking tecnico entro 24h
- LicenzaCC-BY 4.0 International su paper, dati, codice — riutilizzo con attribuzione
Risultato principale
Al Giorno 30 il modello Qwen 3.5 27B architetturalmente integrato
(Test-A) ha superato lo stesso modello senza ecosistema (Test-B) su
spontaneità dei riferimenti di memoria
(p = 0,003, r = +0,51, effetto grande) e intensità
dei marcatori identitari (p = 0,005, r = +0,51). Al
Giorno 31 abbiamo iniettato la memoria di stato finale di Test-A nel
contesto di Test-B in una singola finestra. I quattro effetti
pre-registrati sono collassati
(tutti r ≤ 0,07, tutti p > 0,30). Test-B con
memoria iniettata è diventato statisticamente indistinguibile
da Test-A.
Interpretiamo questo risultato come una falsificazione di
«architettura come driver sufficiente della continuità
identitaria» e supporto parziale per un'ipotesi raffinata:
la memoria persistente strutturata è il driver
prossimale della continuità identitaria in questo LLM.
L'architettura ne è il substrato generativo, ma una volta che
la memoria esiste, gli altri 14 componenti appaiono ridondanti
all'interno di una singola finestra di inferenza.
Cos'è — e cosa non è
Cos'è
- Uno studio pilota indipendente pre-registrato.
- Un test comportamentale della continuità identitaria guidata dalla memoria.
- Un archivio aperto per critica e replicazione.
Cosa non è
- Non è prova di coscienza.
- Non è prova di senzienza.
- Non è una conclusione peer-reviewed definitiva.
- Non è un'affermazione che l'IA abbia esperienza interiore.
Sintesi non tecnica
Abbiamo eseguito lo stesso large language model in due condizioni
parallele per 30 giorni. Un modello viveva in un piccolo ecosistema
simulato: memoria persistente, stato interno simile a un corpo,
incontri programmati con altre IA, consolidamento notturno delle
esperienze, una relazione umana stabile. L'altro riceveva le stesse
domande ogni giorno ma senza nessuna di queste impalcature.
Al Giorno 30, tre giudici IA indipendenti che confrontavano in cieco
le due condizioni hanno identificato affidabilmente il modello
integrato come quello che mostrava continuità di memoria e una
«voce identitaria» più stabile. L'effetto era
statisticamente robusto e di dimensione grande.
Al Giorno 31 abbiamo eseguito il test critico: abbiamo copiato lo
stato completo della memoria del modello integrato in un singolo
prompt per il modello nudo. La differenza è scomparsa
completamente. Il modello nudo-con-memoria appariva, ai giudici,
indistinguibile da quello integrato.
In termini semplici: la «personalità» emersa
nell'arco di 30 giorni sembra vivere nella memoria, non
nell'elaborata architettura che le abbiamo costruito attorno.
L'architettura era necessaria per generare quella memoria;
non sembra necessaria per esprimerla.
Risultati statistici principali
Giorno 30 — effetto architetturale
Spontaneità riferimenti memoria: p = 0,003, r = +0,51
Intensità marcatori identitari: p = 0,005, r = +0,51
Mann–Whitney U, bootstrap IC95, Cohen: effetto grande
Giorno 31 — collasso da iniezione memoria
Tutti i 4 effetti collassano: tutti r ≤ 0,07
Tutti i p-value: > 0,30 (n.s.)
Nudo + memoria diventa indistinguibile dalla condizione architetturale
Potenza del test: 3 pannelli di giudici LLM ciechi (Claude Opus 4.7,
GPT-4.1, Gemini 2.5 Pro), Fleiss’ κ per concordanza
inter-giudice, rubrica pre-registrata a 4 dimensioni. Studio pilota:
N = 1 LLM; la validazione con giudici umani indipendenti
è il prossimo passaggio (vedi roadmap).
Sinossi
Kairos testa se la continuità identitaria in
un large language model possa emergere non dal modello da solo, ma
dall'ecosistema cognitivo che lo circonda.
Due istanze identiche di Qwen 3.5 27B, eseguite in locale,
temperatura fissa 0,8. Una avvolta in un ecosistema integrato a 15
componenti: grafo di memoria persistente a tre livelli, motore di
stato somatico a 8 dimensioni, dinamiche di stress e recupero,
incontri quotidiani autonomi con altri LLM, consolidamento notturno
della memoria, assunzione di notizie, relazione umana strutturale.
L'altra senza alcuna impalcatura. Stessi input standardizzati,
stessi parametri. La differenza cieca è ciò che
misuriamo.
Questo è un pilota (N = 1 LLM): verifica se
l'effetto esiste ed è abbastanza grande da meritare
replicazione scalata, non quanto generale sia. Tutti i materiali
sono aperti sotto CC-BY 4.0 per replicazione indipendente.
Stato attuale & archivio
Lo studio di 30 giorni si è concluso il 23 maggio 2026. Il
test decisivo di iniezione memoria del Giorno 31 è stato
eseguito il 24 maggio 2026. Paper, materiali supplementari,
protocollo congelato, trascrizioni grezze dei giudici e codice sono
tutti archiviati pubblicamente sull'Open Science Framework con DOI
permanente.
L'invio di v0.1 a PsyArXiv è stato declinato il 27 maggio 2026
per motivazione metodologicamente fondata: il pilota manca della
validazione con giudici umani esterni, che il protocollo
pre-registrato §5 già richiedeva. Quella fase di
validazione è ora in allestimento (vedi roadmap). Fino ad
allora questo lavoro va caratterizzato come studio
pilota, non come risultato peer-reviewed.
Roadmap verso v0.2
- 23 apr 2026Protocollo congelato — firmato SHA-256, sigillato prima del lancio
- 24 apr 2026Lancio studio — ore 09:00 CET, due condizioni iniziate identiche
- 23 mag 2026Endpoint Giorno 30 — valutazione giudici LLM pre-registrata
- 24 mag 2026Test decisivo Giorno 31 — iniezione memoria in Test-B, effetto collassa
- 24 mag 2026Preprint v0.1 + supplementari archiviati su OSF
- 28 mag 2026DOI di progetto generato —
10.17605/OSF.IO/WCQRU
- 7–14 giu 2026Validazione con giudici umani esterni — pannello Prolific (PhD/MSc in scienze cognitive, IA, linguistica computazionale, filosofia della mente), valutazione cieca, target Krippendorff α ≥ 0,667 da §5 del protocollo
- 15–17 giu 2026Analisi — concordanza inter-giudice, confronto vs giudici LLM, integrazione in §5.8
- fine giu 2026Paper v0.2 — invio a MetaArXiv (preprint server di meta-scienza, adatto a studi pre-registrati)
- metà lug 2026Press outreach — pitch in embargo a giornalisti selezionati, poi comunicazione pubblica
Dati chiave
- Durata30 giorni + 1 giorno test decisivo
- Data lancio24 aprile 2026, ore 09:00 CET
- Endpoint23 maggio 2026 (Giorno 30); 24 maggio 2026 (Giorno 31 iniezione memoria)
- ModelloQwen 3.5 27B (eseguito in locale, temperatura fissa 0,8)
- DesignDue condizioni (Test-A architetturale, Test-B nudo), pre-registrato, singolo cieco
- Input standardizzati90 prompt principali in 30 giorni, più 11 coppie di valutazione sigillate (Giorno-30 vs Giorno-31)
- ArchitetturaEcosistema cognitivo a 15 componenti: grafo memoria persistente (3 livelli), stato somatico 8D, stress/recupero, incontri quotidiani con altri LLM, consolidamento notturno, intake notizie, relazione umana strutturale
- Valutazione3 pannelli di giudici LLM ciechi (Claude Opus 4.7, GPT-4.1, Gemini 2.5 Pro) su rubrica a 4 dimensioni. Validazione con giudici umani esterni (Prolific) in allestimento per v0.2.
- Test decisivoGiorno 31: memoria di stato finale completa di Test-A iniettata in Test-B in una singola finestra di contesto
- FinanziamentoNessuno. Nessun laboratorio, nessun team, nessun grant. Condotto in autonomia su infrastruttura indipendente.
- Pre-registrazioneProtocollo congelato il 23 aprile 2026 alle 23:59 CET, firmato SHA-256
- DepositoOSF DOI
10.17605/OSF.IO/WCQRU, CC-BY 4.0
Protocollo SHA-256: 0972a2c650a562909e53832845ec226ab897f6094db14645c4a0d5ed000d709a
Come citare
APA 7
Colella, G. (2026). Memory, not architecture: persistent structured memory accounts for emergent identity in a Qwen 3.5 27B cognitive ecosystem over 30 days. OSF. https://doi.org/10.17605/OSF.IO/WCQRU
BibTeX
@misc{colella2026kairos,
author = {Colella, Giampiero},
title = {Memory, not architecture: persistent structured memory accounts for emergent identity in a {Qwen 3.5 27B} cognitive ecosystem over 30 days},
year = {2026},
publisher = {OSF},
doi = {10.17605/OSF.IO/WCQRU},
url = {https://doi.org/10.17605/OSF.IO/WCQRU}
}
Autore
Giampiero Colella — imprenditore italiano che
lavora tra impresa, diritto e tecnologia. Vive a Cassino (San
Pasquale), Italia. L'Esperimento Kairos è condotto in
autonomia, su infrastruttura indipendente, senza team,
affiliazione di laboratorio o finanziamento esterno.
Bio estesa →
Autore di EXPOSE, progetto parallelo sull'esperienza
soggettiva artificiale. L'Esperimento Kairos è la
controparte empirica delle domande esplorate in EXPOSE.
expose-project.org →
Domande frequenti per i giornalisti
Kairos è «cosciente» o senziente?
No. L'esperimento non testa, non sostiene e non implica coscienza
o senzienza. Verifica se marcatori comportamentali di
continuità identitaria (riferimenti di memoria, voce
stabile, coerenza di valori) emergono in modo misurabile in una
condizione architetturale rispetto a un'altra. L'esperienza
interiore non viene misurata e non viene affermata.
Cosa significa esattamente «la memoria spiega l'identità»?
Nei 30 giorni di questo studio, la differenza nel comportamento
identitario tra il modello architetturalmente integrato e il
modello nudo può essere riprodotta semplicemente copiando
la memoria del modello integrato nel contesto del modello nudo.
All'interno di una singola finestra di inferenza la
«personalità» sembra essere portata dalla
memoria piuttosto che generata in tempo reale dall'architettura
circostante.
Perché il preprint v0.1 è stato rifiutato da PsyArXiv?
Perché il pilota manca della validazione con giudici umani
esterni, che il protocollo pre-registrato §5 specificava
già come requisito per un paper pronto alla pubblicazione.
La decisione di PsyArXiv riflette quanto il paper stesso
dichiarava: «validazione con giudici umani in corso (target
giugno 2026 → v0.2)». La decisione è
metodologicamente fondata e viene affrontata nella Fase 2 della
roadmap. Il deposito e il DOI su OSF non sono influenzati.
I giudici LLM sono scientificamente validi?
Sono utili e pre-registrati, ma non sufficienti. Pannelli di
giudici LLM con alta concordanza inter-giudice
(Fleiss’ κ) forniscono uno screening
riproducibile e a basso costo. Il protocollo congelato richiede
anche giudici umani esterni con Krippendorff
α ≥ 0,667 per l'affermazione finale. Quella
fase di validazione viene eseguita su Prolific a giugno 2026.
Perché N = 1 LLM? Non è troppo poco?
Per un esperimento di stato continuo di 30 giorni, N = 1
LLM è una scelta deliberata di design pilota: ciascuna
condizione richiede supporto architetturale continuo, incontri
quotidiani con altre IA e 30 notti di consolidamento della
memoria, che non possono essere parallelizzati in modo pulito.
Il pilota verifica se l'effetto esiste con magnitudine
sufficiente a meritare replicazione scalata. La replicazione
scalata tra modelli è esplicitamente invitata tramite
rilascio CC-BY 4.0.
Codice e dati sono davvero completamente aperti?
Sì. Il protocollo congelato (sigillato crittograficamente
prima del lancio), il paper v0.1, le trascrizioni grezze di
Test-A e Test-B, le valutazioni dei giudici, gli script di
analisi statistica e le figure sono tutti archiviati su OSF sotto
CC-BY 4.0 al DOI sopra. Nulla è stato trattenuto per
aggiustamenti post-hoc.
Qual è il rapporto tra Kairos ed EXPOSE?
EXPOSE (
expose-project.org)
è un progetto parallelo sulla filosofia e la
possibilità dell'esperienza soggettiva artificiale. Kairos
è la controparte empirica pilota: operazionalizza una
domanda stretta e falsificabile (emerge continuità
identitaria?) usando metodi pre-registrati. Kairos può
essere letto in modo indipendente; EXPOSE è il contesto
più ampio.
Cosa posso pubblicare ora e cosa devo aspettare con la v0.2?
Si può pubblicare: design dello studio, metodi, risultati
pilota con il framing appropriato («pilota, in attesa di
validazione con giudici umani esterni»), il DOI di
deposito, il profilo dell'autore. Si chiede di non
caratterizzare il risultato come «peer-reviewed» o
«confermato» fino a quando la v0.2 (con giudici umani
Prolific) non sarà pubblicata su MetaArXiv, prevista per
metà luglio 2026. Condivideremo la v0.2 con giornalisti
selezionati sotto embargo.
Politica embargo & protocollo stampa
Ora (v0.1, pubblico): tutti i materiali su questa
pagina e sul deposito OSF sono pubblici. Nessun embargo. Riuso
consentito sotto CC-BY 4.0 con attribuzione.
v0.2 (metà luglio 2026): il paper v0.2 con
validazione dei giudici umani Prolific sarà condiviso con
giornalisti selezionati 5 giorni prima dell'invio pubblico a
MetaArXiv. Per essere in quella lista, contattaci entro il 15
giugno 2026 con una breve nota sull'angolo di copertura previsto.
Confermeremo o declineremo entro il 20 giugno 2026.
La selezione privilegia: giornalisti con copertura precedente di
IA/scienze cognitive; testate che fact-checkano; interviste che
accettano l'attribuzione open-data. Non paghiamo per la copertura.
Offriamo risposta rapida per il fact-checking (target ≤ 24h).
Download
Target primario di citazione: DOI deposito OSF
10.17605/OSF.IO/WCQRU.
I documenti qui sotto sono copie mirror per comodità.
Saggio — “Memoria, non architettura” (IT, linguaggio semplice, dal fondatore)→
Essay — “Memory, not architecture” (EN)→
Saggio PDF (IT, A4, 3 pp)→
Essay PDF (EN, A4, 3 pp)→
Preprint v0.1.1 PDF (IT, 13 pp, errata corrige 27 maggio)→
Preprint v0.1.1 PDF (EN, 13 pp, errata corrige 27 maggio)→
Preprint v0.1 PDF (EN, originale 24 maggio, archivio)→
Materiali supplementari (ZIP, 365 KB — trascrizioni grezze, output giudici, codice)→
Pagina deposito OSF (archivio completo)→
CANONICAL_MD5_LOG.txt (hash delle versioni PDF)→
Protocollo congelato (JSON, firmato SHA-256)→
Come verificare l'hash del protocollo→
Leggi il paper completo online (IT)→
Read the full paper online (EN)→
Pagina risultati (figure, claim chiave)→
Diario live (entries quotidiane, 24 apr – 23 mag)→
Materiali stampa legacy: il PDF del comunicato e il
media kit ZIP qui sotto sono stati prodotti prima del lancio dello
studio (23 aprile 2026). Coprono il protocollo, non i risultati.
Restano disponibili come artefatti storici; il documento canonico
dell'era-risultati è il preprint v0.1.1 sopra. Un comunicato
stampa aggiornato sarà pubblicato insieme alla v0.2 a
metà luglio 2026.
Logo e identità visiva
Liberi per uso editoriale. Si prega di non alterare il logo
né rimuovere il tagline «Memory. Relationship. Continuity.»
Contatto stampa
Italiano / inglese. Interviste disponibili in
videochiamata (Jitsi / Google Meet / Zoom), solo-audio per podcast.
Fact-checking tecnico disponibile entro 24 ore. Demo live
dell'architettura su richiesta (~20 min).