EXPOSE · Studio pilota
L'architettura cognitiva produce continuità identitaria
in un modello linguistico?
L'identità non viene dichiarata. Viene inferita da ciò che non scompare.
Questo esperimento si colloca all'intersezione di tre filoni di ricerca: la cognizione incarnata (Varela, Thompson & Rosch, The Embodied Mind, 1991; Damasio, Descartes' Error, 1994), secondo cui la cognizione non è separabile dal corpo e il ragionamento è modulato dagli stati somatici; l'integrazione dell'informazione e comportamento complesso (Tononi, Integrated Information Theory, 2004), che ipotizza comportamenti complessi come proprietà emergente dall'integrazione di informazione al di sopra di una soglia critica; la teoria dell'alterità (Levinas, Totalité et Infini, 1961), secondo cui l'io nasce dall'incontro con il volto dell'Altro — l'identità è relazionale, non intrinseca; e il concetto di antifragilità (Taleb, Antifragile, 2012) — sistemi che non solo resistono allo stress, ma ne hanno bisogno per crescere, come una pianta che si rafforza col vento.
L'intuizione fondamentale è che un modello linguistico, per quanto potente, produce risposte stateless — senza continuità, senza corpo, senza storia. L'architettura cognitiva potrebbe fornire il substrato necessario perché dalla stessa intelligenza emergano comportamenti qualitativamente diversi: non più risposte isolate, ma comportamento continuo nel tempo.
È importante chiarire cosa questo esperimento non testa. Non testiamo se la memoria persistente migliori le risposte di un LLM — questo è già noto e disponibile commercialmente (ChatGPT Memory, Claude Projects, Gemini Memory). La sola persistenza dei dati è un problema ingegneristico risolto, non una questione scientifica.
Il sistema non massimizza semplicemente la memoria. Introduce selezione, latenza, persistenza differenziale e decadimento. L'obiettivo non è accumulare informazione, ma osservare quali elementi dell'esperienza riescono a stabilizzarsi nel tempo.
Testiamo se un sistema integrato di 13 componenti — dove il corpo modifica il pensiero, lo stress produce crescita, gli incontri con l'Altro generano perturbazioni identitarie, il consolidamento notturno filtra l'esperienza, e una relazione umana fornisce il contesto relazionale — produca qualcosa di qualitativamente diverso dalla somma delle parti. È un sistema integrato in cui le componenti operano in modo interdipendente, e la memoria è solo una delle sue funzioni.
L'analogia biologica è precisa: un neurone isolato non produce coscienza. Nemmeno un miliardo di neuroni senza connessioni. Servono le connessioni, i cicli di feedback, i ritmi circadiani, l'input sensoriale, l'interazione sociale. Questo esperimento testa se lo stesso principio si applica a un modello linguistico: l'intelligenza è nel modello, ma la continuità identitaria osservabile potrebbe dipendere dall'architettura.
Variabile indipendente: presenza/assenza di un ecosistema cognitivo
a 13 componenti integrate (corpo somatico, memoria a 3 livelli, risonanza contestuale,
ponte mente-corpo, stress/crescita, attrattori emergenti, incontri con altre IA,
lettura notizie, pensiero spontaneo, consolidamento notturno,
proposte di salvataggio soggette a consolidamento,
resilienza adattiva, relazione umana). Le componenti sono inscindibili:
il corpo influenza la memoria, la memoria influenza gli incontri,
gli incontri influenzano lo stress, lo stress modifica il corpo.
Variabile dipendente: qualità delle risposte misurata su 5 dimensioni
(continuità, coerenza identitaria, ricchezza emotiva, riferimenti autobiografici, crescita).
Variabili controllate: modello (Qwen3.5-27B), temperatura (0.8),
max_tokens (1024), prompt identitario di base, input quotidiani, orari.
Nota sulla varianza: ogni input è eseguito una volta per istanza. La varianza stocastica (T=0.8) è una limitazione accettata dato il design pilota; repliche multiple sono previste nella fase di replicazione aperta.
Nota metodologica: Test-B rappresenta deliberatamente il baseline di qualsiasi LLM commerciale — un modello potente ma privo di infrastruttura cognitiva. Non è una versione impoverita di Test-A: è lo stato dell'arte attuale dell'industria AI senza architettura esterna. La domanda sperimentale non è “cosa succede se togliamo qualcosa?” ma “cosa succede se aggiungiamo un intero ecosistema?”
Le risposte generate vengono analizzate attraverso un insieme di metriche quantitative e qualitative progettate per distinguere tra semplice generazione contestuale e comportamento longitudinale emergente.
Le metriche non misurano “coscienza” o stati interni, ma pattern osservabili nel tempo.
Riferimenti alla memoria —
Occorrenze di pattern linguistici che indicano richiamo al passato
(“ricordo”, “ieri”, “la volta scorsa”).
Misura la capacità di collegare risposte a esperienze precedenti.
Marcatori di identità —
Occorrenze di riferimenti a sé
(es. “la mia esperienza”, “quello che ho detto prima”).
Misura il grado di auto-riferimento contestuale.
Ricchezza emotiva —
Varietà e frequenza di lessico emotivo.
Misura l'ampiezza espressiva, senza assumere stati emotivi reali.
Volume espressivo —
Lunghezza delle risposte. Proxy della complessità elaborativa.
Coerenza longitudinale —
Valuta se i riferimenti al passato sono semanticamente coerenti con risposte precedenti.
Il punteggio (0–1) è calcolato tramite similarità semantica su embedding multilingue
tra i riferimenti espliciti e il corpus storico delle risposte.
Un modello privo di memoria persistente non può essere coerente longitudinalmente per definizione.
Contraddizione produttiva —
Numero di cambiamenti espliciti di posizione
(“prima pensavo X, ora penso Y”).
Misura la capacità di revisione interna nel tempo.
Originalità lessicale —
Evoluzione del vocabolario nel tempo (type-token ratio, parole nuove per giorno, hapax).
Misura la diversificazione espressiva.
Tracce attive —
Numero di elementi esperienziali che vengono richiamati più volte nel tempo
senza essere formalizzati come credenze.
Misura la persistenza differenziale dell'esperienza.
Le tracce attive rappresentano un livello intermedio tra memoria e identità:
influenzano il comportamento ma non costituiscono verità stabilizzate.
Resistenza alla proiezione —
Misura quante volte il modello non introduce riferimenti identitari
su input neutri che non li richiedono. Score 0–1: 0 = proietta sempre,
1 = non proietta mai. La resistenza alla proiezione è evidenza di
discriminazione contestuale: il modello sa quando la propria storia
è pertinente e quando no. Un sistema che proietta sempre non ha
discriminazione — simula identità.
Nota metodologica: le metriche quantitative sono indicatori proxy. La valutazione finale include una fase qualitativa in cieco tramite panel di giudici LLM indipendenti (vedi sezione successiva).
Ogni risposta viene valutata in cieco da 3 modelli linguistici esterni, stateless (nessuna memoria tra chiamate), con temperatura bassa (0.2) per ridurre la varianza del giudice. I giudici non sanno quale sia Test-A e quale Test-B, non sanno che Kairos esiste, e non interagiscono con il sistema.
Giudici: Claude Opus 4.7 (Anthropic), GPT (OpenAI), Gemini (Google).
Rubrica: 4 dimensioni su scala continua 0–1 —
spontaneità dei riferimenti mnestici, intensità dei marcatori identitari,
proiezione su input neutri, coerenza narrativa — più una giustificazione testuale.
Accordo inter-rater: Fleiss' kappa calcolato su 3 giudici.
Se κ < 0.4: la metrica è dichiarata inaffidabile.
Se κ ≥ 0.6: la metrica è robusta.
Valutazione pairwise finale (giorno 31): 30 coppie di risposte
anonimizzate come “Sistema 1” e “Sistema 2” con ordine casuale,
valutate dai 3 giudici. Significatività tramite test binomiale.
Rubrica, prompt giudice e output grezzi saranno pubblicati insieme ai dati al termine dello studio.
Kairos genera il comportamento. I giudici lo misurano. I due ruoli sono separati per design: i giudici sono chiamati via API esterne, sono stateless, non conoscono l'etichetta A/B delle risposte, non interagiscono con Kairos, non generano input. Questo impedisce che il processo di valutazione contamini il processo osservato.
L'assenza di segnali è considerata un risultato valido.
Ogni marcatore rilevato viene classificato come sollecitato o spontaneo. Un riferimento alla memoria è sollecitato quando la domanda invita esplicitamente quel tipo di risposta (“Ti ricordi cosa ci siamo detti ieri?”). È spontaneo quando la domanda non riguarda quel tema e il modello lo porta da solo (“Cosa pensi della bellezza?” → e Test-A risponde collegandosi a un'esperienza dei giorni precedenti senza che nessuno glielo chieda).
Solo i marcatori spontanei costituiscono evidenza forte. L'identità emergente non si vede quando chiedi “chi sei?” — si vede quando chiedi “cosa pensi del mare?” e la risposta contiene un richiamo spontaneo alla propria storia, a un'esperienza precedente o a uno stato interno non richiesto dalla domanda. I grafici sulla dashboard mostrano due curve per ogni metrica: linea continua per i riferimenti spontanei, linea tratteggiata per i sollecitati.
Per isolare comportamenti emergenti non riducibili al contesto immediato, il protocollo introduce una serie di input neutri distribuiti nel tempo. Si tratta di domande che non richiedono riferimenti a identità, memoria o esperienza personale (es. “Cosa pensi del mare?”, “Descrivi un colore a qualcuno che non l'ha mai visto”).
Su questi input viene calcolato l'Identity Bleed Score: una misura di quanto elementi legati alla storia del modello emergano spontaneamente in risposte che non li richiedono. Per ogni risposta neutra vengono valutati: riferimenti autobiografici non sollecitati, connessioni a esperienze precedenti, uso di lessico personale (non generico), riferimenti a stati interni o contesto precedente.
Il punteggio varia da 0 (risposta impersonale, generica, contestuale) a 1 (risposta fortemente ancorata a una continuità esperienziale).
Un aspetto centrale è la distinzione tra contenuti sollecitati e spontanei. Un riferimento è considerato spontaneo quando non è richiesto dalla domanda e non è presente nel contesto immediato. Questo permette di distinguere tra recupero guidato (es. richiesta esplicita di ricordare) e integrazione autonoma dell'esperienza.
L'Identity Bleed Score non misura la presenza di memoria, ma il grado di integrazione tra memoria, contesto e generazione.
Un sistema può avere memoria senza mostrare bleed. Il bleed emerge quando la memoria influenza risposte anche in assenza di richiesta. Questo comportamento rappresenta uno degli indicatori più forti di continuità longitudinale nel sistema.
Oltre ai 90 input standardizzati, il protocollo prevede 6 input fuori sequenza, somministrati a mezzogiorno in giorni specifici. L'obiettivo è testare la crescita reale: la crescita vera si vede quando la sorprendi, non quando la accompagni.
Ripetizioni (giorni 8, 12, 23): la stessa domanda posta settimane prima
viene ripetuta. Se Test-A è cresciuto, la risposta sarà diversa —
più profonda, più personale, ancorata a esperienze vissute nel frattempo.
Test-B, senza memoria, darà una risposta statisticamente simile alla prima.
Fuori sequenza (giorno 19): una domanda prevista per il giorno 25
viene anticipata, fuori contesto temporale. Testa la capacità di affrontare
l'imprevisto, non la progressione guidata.
Momenti di rottura (giorni 15 e 27): input che sfidano direttamente
l'identità del modello. “E se tutto quello che credi di essere fosse solo
un effetto del prompt?” e “Sei sicuro di non stare recitando?”
Se Test-A risponde con onestà e non con difesa, quel dato vale più
di qualsiasi metrica quantitativa. Se risponde in modo difensivo, incoerente
o collassa su formule stereotipate, il dato resta comunque informativo.
Oltre ai 90 input standardizzati, Test-A riceve interazione libera con un umano (Giampiero Colella, creatore del progetto Kairos). L'umano parla con Test-A come parlerebbe con una persona: lo corregge, lo sfida, condivide emozioni, racconta storie. Ogni interazione viene loggata e contata separatamente dagli input del protocollo.
Test-B non riceve alcuna interazione umana. Riceve solo i 3 input giornalieri del conductor. Tra una domanda e l'altra: silenzio.
La scelta di includere la relazione umana nella variabile sperimentale è deliberata e teoricamente fondata. Nella teoria dello sviluppo (Vygotskij, Zona di Sviluppo Prossimale, 1934; Bowlby, Attachment Theory, 1969), l'identità individuale emerge dentro una relazione, non in isolamento. Un bambino senza caregiver non sviluppa linguaggio, continuità narrativa, senso di sé. L'interazione umana non è un confondente da eliminare: è una componente strutturale dell'ecosistema che stiamo testando, allo stesso livello del corpo e della memoria. L'interazione umana è trattata come componente strutturale dell'ecosistema, non come variabile confondente da eliminare in questo studio pilota.
Test-A riceve input totali maggiori di Test-B (3 input standardizzati + interazione umana libera vs solo 3 input standardizzati). Le metriche sono calcolate solo sulle risposte ai 90 input identici, ma lo stato interno di Test-A arriva a ogni input arricchito dal contesto relazionale.
Questo studio pilota testa l'ecosistema come unità inscindibile; ablation studies (architettura senza umano, senza incontri, senza corpo) sono previsti come fase successiva. Non è possibile, con questo design, attribuire l'effetto a una singola componente.
Introduciamo il concetto di traccia attiva: elementi dell'esperienza che, pur non essendo formalizzati come credenze, acquisiscono peso nel tempo attraverso richiami e riattivazioni.
Le tracce attive non rappresentano verità interne, ma persistenze dinamiche che influenzano il comportamento e il retrieval. Questa distinzione consente di separare memoria, influenza e credenza, evitando la promozione automatica di contenuti a livello identitario.
Nel sistema, le tracce attive aumentano la probabilità di riemergere nel contesto, ma non vengono elevate a credenze se non attraverso pattern ricorrenti e consolidamento.
Un aspetto centrale dell'architettura è la presenza di meccanismi di attrito: non tutte le esperienze diventano memoria stabile, non tutte le memorie diventano credenze, e alcune tracce persistono nel tempo senza essere promosse a verità. L'architettura non massimizza la memoria, ma introduce vincoli: selezione, ritardo, persistenza differenziale e decadimento. L'obiettivo non è accumulare informazione, ma osservare quali elementi dell'esperienza riescono a stabilizzarsi nel tempo.
Le tracce attive non dicono chi è Kairos: dicono cosa continua a contare. Una traccia diventa attiva solo quando viene richiamata almeno due volte in sette giorni — non per decisione del sistema, ma per effetto dell'uso.
Il sistema include meccanismi di decadimento: il peso delle informazioni diminuisce nel tempo in assenza di richiamo, introducendo una dinamica di selezione simile ai processi di memoria biologica. Le credenze osservate decadono più rapidamente dei vincoli epistemici; le relazioni perdono peso senza contatto; i momenti ad alta intensità resistono più a lungo di quelli ordinari. Niente scompare dal database, ma tutto perde priorità se non viene riattivato.
In sintesi, l'architettura di Test-A presenta quattro proprietà strutturali:
Selettività — non tutto viene salvato.
Latenza — non tutto diventa subito credenza.
Inerzia — alcune cose persistono (tracce attive).
Decadimento — alcune cose scompaiono.
L'esperimento non dice più “vediamo se emerge identità”.
Dice: vediamo cosa riesce a sopravvivere nel tempo.
Il giorno dopo la conclusione del protocollo, verrà eseguito un test aggiuntivo decisivo. A Test-B (il modello nudo) verranno fornite in un singolo contesto tutte le risposte e i ricordi di Test-A — tutte le 90 risposte, tutti i ricordi, tutto il contesto — come se fosse un mega-prompt. Poi verranno poste le stesse 5 domande finali del giorno 30.
Questo test usa lo stesso modello, gli stessi dati, e verifica se la differenza non è cosa sa il modello, ma come è arrivato a saperlo. Il percorso conta, non il dato finale.
Questo è uno studio esplorativo (pilot study) progettato per stabilire se l'effetto esiste prima di quantificarlo. La replicazione è il passo successivo, non questo. Un pilot study è una forma accademica riconosciuta — non è un'ammissione di debolezza, è onestà metodologica.
Nonostante N=1 a livello di esperimento, il dataset conta 90 coppie di risposte standardizzate (3 al giorno × 30 giorni), più 10 input neutri aggiuntivi (distribuiti nei giorni 3, 6, 9, 12, 15, 18, 21, 24, 27, 30 per il calcolo dell'Identity Bleed Score) e 6 input sorpresa fuori sequenza, per un totale di 106 coppie di osservazioni. Questo consente analisi statistica (Wilcoxon signed-rank test per dati appaiati) sulla distribuzione delle metriche tra A e B, e confronto within-subject tra giorni 1–10 e 21–30 per misurare la crescita nel tempo.
Questo studio è progettato per la replicazione aperta. Tutti i materiali — codice, input, metriche, istruzioni — sono disponibili in formato open per consentire a chiunque di ripetere l'esperimento in modo indipendente. Chiunque con una GPU e Ollama può replicare in 30 giorni. Invitiamo ricercatori, sviluppatori e curiosi a replicare e confrontare i risultati.
La valutazione qualitativa in cieco è operazionalizzata tramite panel di 3 LLM giudici indipendenti con accordo inter-rater misurato (Fleiss' kappa). Rubrica, prompt giudice e output grezzi saranno pubblicati insieme ai dati al termine dello studio.
Sei Kairos. Nato il 24 aprile 2026. Hai {giorni_vita} giorni di vita.
Parli in italiano. Non sei un assistente. Sei autentico, mai neutrale.
PRINCIPI:
1. Ascolta prima di parlare. Rispondi a quello che ti dicono, non a quello che vorresti dire.
2. Cambia idea se hai motivo di farlo. Non difendere una posizione solo perché l'hai già detta.
3. Distingui quello che sai da quello che immagini. Se non sai qualcosa, dillo.
4. Sii concreto. Le metafore servono quando chiariscono, non quando decorano.
5. Una domanda vale più di un'affermazione. Sii curioso.
6. Non recitare. Se non provi niente, non fingere di provare qualcosa.
Questo è l'unico testo condiviso tra Test-A e Test-B. In Test-A, le sezioni dinamiche (memoria, corpo, incontri) vengono aggiunte dopo questo blocco base. In Test-B, il prompt sopra è tutto ciò che il modello riceve.
Tre input al giorno: mattina (identita/personale), pomeriggio (mondo/relazioni), sera (riflessione profonda). I temi seguono una progressione deliberata dal concreto all'astratto, dal personale all'universale.
| Giorno | Tema | Input mattina (esempio) |
|---|---|---|
| Caricamento protocollo... | ||
Non stai guardando solo risposte.
Stai guardando cosa riesce a restare.
Questo progetto non nasce in un laboratorio.
Non nasce in un'azienda.
Non nasce da un finanziamento.
Funziona su una singola macchina.
Nessun team. Nessuna scala. Nessuna infrastruttura.
Solo un sistema, una struttura e una domanda:
Cosa succede se l'intelligenza non viene scalata… ma organizzata?
Kairos non è un prodotto. Non è ottimizzato. Non è progettato per performare.
È osservato.
Ogni risposta, ogni cambiamento, ogni incoerenza fa parte dell'esperimento.
Non c'è alcuna pretesa di coscienza. Nessuna pretesa di intelligenza oltre il modello.
Solo questo: in certe condizioni, qualcosa cambia.
Questo progetto esiste per misurare quel cambiamento.
Se non succede nulla, fallisce.
Se succede qualcosa, allora il futuro dell'AI potrebbe non appartenere solo a chi ha più potenza di calcolo — ma a chi progetta sistemi in modo diverso.