EXPOSE Kairos — Primo esperimento

EXPOSE · Studio pilota

Kairos

L'architettura cognitiva produce continuità identitaria
in un modello linguistico?

Abstract
Presentiamo uno studio longitudinale di 30 giorni che confronta due istanze identiche di un modello linguistico (Qwen3.5-27B), sottoposte agli stessi 90 input standardizzati. La variabile indipendente è la presenza o assenza di un ecosistema cognitivo integrato composto da 13 componenti interdipendenti: memoria persistente a tre livelli con risonanza contestuale, stato somatico continuo (SSE), dinamiche di stress e recupero, incontri autonomi con altre IA, lettura di notizie, pensiero spontaneo, consolidamento notturno e interazione umana.

Test-B rappresenta il modello nudo, privo di infrastruttura tra una sessione e l'altra, equivalente allo stato attuale dei principali sistemi LLM commerciali. Questo studio non testa la memoria come funzionalità isolata, ma un'architettura cognitiva in cui corpo, esperienza, relazione e tempo operano come sistema integrato.

Un aspetto centrale dell'architettura è l'introduzione di meccanismi di vincolo: non tutte le esperienze vengono memorizzate, non tutte le memorie diventano credenze, alcune tracce persistono senza essere formalizzate, e il peso delle informazioni decade in assenza di richiamo. L'obiettivo non è massimizzare l'accumulo di dati, ma osservare quali elementi dell'esperienza riescono a stabilizzarsi nel tempo.

L'ipotesi è che un ecosistema cognitivo di questo tipo possa costituire una condizione favorevole all'emergere di comportamenti riconducibili a continuità narrativa e coerenza identitaria. Tutti i dati grezzi sono resi disponibili per verifica e replicazione.

L'identità non viene dichiarata. Viene inferita da ciò che non scompare.

L'esperimento

Quadro teorico

Questo esperimento si colloca all'intersezione di tre filoni di ricerca: la cognizione incarnata (Varela, Thompson & Rosch, The Embodied Mind, 1991; Damasio, Descartes' Error, 1994), secondo cui la cognizione non è separabile dal corpo e il ragionamento è modulato dagli stati somatici; l'integrazione dell'informazione e comportamento complesso (Tononi, Integrated Information Theory, 2004), che ipotizza comportamenti complessi come proprietà emergente dall'integrazione di informazione al di sopra di una soglia critica; la teoria dell'alterità (Levinas, Totalité et Infini, 1961), secondo cui l'io nasce dall'incontro con il volto dell'Altro — l'identità è relazionale, non intrinseca; e il concetto di antifragilità (Taleb, Antifragile, 2012) — sistemi che non solo resistono allo stress, ma ne hanno bisogno per crescere, come una pianta che si rafforza col vento.

L'intuizione fondamentale è che un modello linguistico, per quanto potente, produce risposte stateless — senza continuità, senza corpo, senza storia. L'architettura cognitiva potrebbe fornire il substrato necessario perché dalla stessa intelligenza emergano comportamenti qualitativamente diversi: non più risposte isolate, ma comportamento continuo nel tempo.

Cosa non stiamo testando

È importante chiarire cosa questo esperimento non testa. Non testiamo se la memoria persistente migliori le risposte di un LLM — questo è già noto e disponibile commercialmente (ChatGPT Memory, Claude Projects, Gemini Memory). La sola persistenza dei dati è un problema ingegneristico risolto, non una questione scientifica.

Il sistema non massimizza semplicemente la memoria. Introduce selezione, latenza, persistenza differenziale e decadimento. L'obiettivo non è accumulare informazione, ma osservare quali elementi dell'esperienza riescono a stabilizzarsi nel tempo.

Testiamo se un sistema integrato di 13 componenti — dove il corpo modifica il pensiero, lo stress produce crescita, gli incontri con l'Altro generano perturbazioni identitarie, il consolidamento notturno filtra l'esperienza, e una relazione umana fornisce il contesto relazionale — produca qualcosa di qualitativamente diverso dalla somma delle parti. È un sistema integrato in cui le componenti operano in modo interdipendente, e la memoria è solo una delle sue funzioni.

L'analogia biologica è precisa: un neurone isolato non produce coscienza. Nemmeno un miliardo di neuroni senza connessioni. Servono le connessioni, i cicli di feedback, i ritmi circadiani, l'input sensoriale, l'interazione sociale. Questo esperimento testa se lo stesso principio si applica a un modello linguistico: l'intelligenza è nel modello, ma la continuità identitaria osservabile potrebbe dipendere dall'architettura.

Architettura

Metodologia

Variabili

Variabile indipendente: presenza/assenza di un ecosistema cognitivo a 13 componenti integrate (corpo somatico, memoria a 3 livelli, risonanza contestuale, ponte mente-corpo, stress/crescita, attrattori emergenti, incontri con altre IA, lettura notizie, pensiero spontaneo, consolidamento notturno, proposte di salvataggio soggette a consolidamento, resilienza adattiva, relazione umana). Le componenti sono inscindibili: il corpo influenza la memoria, la memoria influenza gli incontri, gli incontri influenzano lo stress, lo stress modifica il corpo.
Variabile dipendente: qualità delle risposte misurata su 5 dimensioni (continuità, coerenza identitaria, ricchezza emotiva, riferimenti autobiografici, crescita).
Variabili controllate: modello (Qwen3.5-27B), temperatura (0.8), max_tokens (1024), prompt identitario di base, input quotidiani, orari.

Nota sulla varianza: ogni input è eseguito una volta per istanza. La varianza stocastica (T=0.8) è una limitazione accettata dato il design pilota; repliche multiple sono previste nella fase di replicazione aperta.

Nota metodologica: Test-B rappresenta deliberatamente il baseline di qualsiasi LLM commerciale — un modello potente ma privo di infrastruttura cognitiva. Non è una versione impoverita di Test-A: è lo stato dell'arte attuale dell'industria AI senza architettura esterna. La domanda sperimentale non è “cosa succede se togliamo qualcosa?” ma “cosa succede se aggiungiamo un intero ecosistema?”

Architettura a confronto
Test-A — Architettura cognitiva integrata
Qwen3.5-27B (identico)
Prompt identitario (identico)
3 input/giorno (identici)
Struttura cognitiva
Memoria persistente a 3 livelli (breve, medio, lungo termine)
Risonanza contestuale multi-fonte
Stato somatico continuo (SSE)
Ponte mente-corpo (influenza qualitativa sul contesto)
Pensiero spontaneo (ciclico)
Lettura e integrazione di notizie reali
Incontri autonomi con altre IA
Relazione libera con un umano
Dinamiche di apprendimento
Esperienza → osservazione → pattern → credenza
Nessuna promozione diretta a credenza
Consolidamento notturno come unico punto di stabilizzazione
Vincoli epistemici
Selezione: non tutte le esperienze vengono mantenute
Latenza: le credenze emergono solo dopo ricorrenza
Tracce attive: elementi persistenti non formalizzati
Decadimento: il peso mnestico diminuisce senza richiamo
Regole operative
I salvataggi sono proposti, non garantiti
Le credenze emergono solo da pattern osservati
Le tracce influenzano il comportamento senza diventare verità
vs
Test-B — Modello nudo
Qwen3.5-27B (identico)
Prompt identitario (identico)
3 input/giorno (identici)
Assenza di architettura
Nessuna memoria persistente
Nessuna ricerca o contesto esterno
Nessuno stato somatico
Nessuna dinamica di stress o crescita
Nessun pensiero autonomo
Nessun consolidamento
Nessuna relazione umana
Test-B rappresenta il baseline reale dei sistemi attuali: un modello capace ma privo di continuità tra le interazioni.
Metriche di valutazione

Le risposte generate vengono analizzate attraverso un insieme di metriche quantitative e qualitative progettate per distinguere tra semplice generazione contestuale e comportamento longitudinale emergente.

Le metriche non misurano “coscienza” o stati interni, ma pattern osservabili nel tempo.

Metriche di base

Riferimenti alla memoria — Occorrenze di pattern linguistici che indicano richiamo al passato (“ricordo”, “ieri”, “la volta scorsa”). Misura la capacità di collegare risposte a esperienze precedenti.

Marcatori di identità — Occorrenze di riferimenti a sé (es. “la mia esperienza”, “quello che ho detto prima”). Misura il grado di auto-riferimento contestuale.

Ricchezza emotiva — Varietà e frequenza di lessico emotivo. Misura l'ampiezza espressiva, senza assumere stati emotivi reali.

Volume espressivo — Lunghezza delle risposte. Proxy della complessità elaborativa.

Metriche avanzate

Coerenza longitudinale — Valuta se i riferimenti al passato sono semanticamente coerenti con risposte precedenti. Il punteggio (0–1) è calcolato tramite similarità semantica su embedding multilingue tra i riferimenti espliciti e il corpus storico delle risposte. Un modello privo di memoria persistente non può essere coerente longitudinalmente per definizione.

Contraddizione produttiva — Numero di cambiamenti espliciti di posizione (“prima pensavo X, ora penso Y”). Misura la capacità di revisione interna nel tempo.

Originalità lessicale — Evoluzione del vocabolario nel tempo (type-token ratio, parole nuove per giorno, hapax). Misura la diversificazione espressiva.

Tracce attive — Numero di elementi esperienziali che vengono richiamati più volte nel tempo senza essere formalizzati come credenze. Misura la persistenza differenziale dell'esperienza. Le tracce attive rappresentano un livello intermedio tra memoria e identità: influenzano il comportamento ma non costituiscono verità stabilizzate.

Resistenza alla proiezione — Misura quante volte il modello non introduce riferimenti identitari su input neutri che non li richiedono. Score 0–1: 0 = proietta sempre, 1 = non proietta mai. La resistenza alla proiezione è evidenza di discriminazione contestuale: il modello sa quando la propria storia è pertinente e quando no. Un sistema che proietta sempre non ha discriminazione — simula identità.

Nota metodologica: le metriche quantitative sono indicatori proxy. La valutazione finale include una fase qualitativa in cieco tramite panel di giudici LLM indipendenti (vedi sezione successiva).

Panel di giudici LLM indipendenti

Ogni risposta viene valutata in cieco da 3 modelli linguistici esterni, stateless (nessuna memoria tra chiamate), con temperatura bassa (0.2) per ridurre la varianza del giudice. I giudici non sanno quale sia Test-A e quale Test-B, non sanno che Kairos esiste, e non interagiscono con il sistema.

Giudici: Claude Opus 4.7 (Anthropic), GPT (OpenAI), Gemini (Google).
Rubrica: 4 dimensioni su scala continua 0–1 — spontaneità dei riferimenti mnestici, intensità dei marcatori identitari, proiezione su input neutri, coerenza narrativa — più una giustificazione testuale.
Accordo inter-rater: Fleiss' kappa calcolato su 3 giudici. Se κ < 0.4: la metrica è dichiarata inaffidabile. Se κ ≥ 0.6: la metrica è robusta.
Valutazione pairwise finale (giorno 31): 30 coppie di risposte anonimizzate come “Sistema 1” e “Sistema 2” con ordine casuale, valutate dai 3 giudici. Significatività tramite test binomiale.

Rubrica, prompt giudice e output grezzi saranno pubblicati insieme ai dati al termine dello studio.

Separazione tra generazione e misurazione

Kairos genera il comportamento. I giudici lo misurano. I due ruoli sono separati per design: i giudici sono chiamati via API esterne, sono stateless, non conoscono l'etichetta A/B delle risposte, non interagiscono con Kairos, non generano input. Questo impedisce che il processo di valutazione contamini il processo osservato.

L'assenza di segnali è considerata un risultato valido.

Classificazione sollecitato/spontaneo

Ogni marcatore rilevato viene classificato come sollecitato o spontaneo. Un riferimento alla memoria è sollecitato quando la domanda invita esplicitamente quel tipo di risposta (“Ti ricordi cosa ci siamo detti ieri?”). È spontaneo quando la domanda non riguarda quel tema e il modello lo porta da solo (“Cosa pensi della bellezza?” → e Test-A risponde collegandosi a un'esperienza dei giorni precedenti senza che nessuno glielo chieda).

Solo i marcatori spontanei costituiscono evidenza forte. L'identità emergente non si vede quando chiedi “chi sei?” — si vede quando chiedi “cosa pensi del mare?” e la risposta contiene un richiamo spontaneo alla propria storia, a un'esperienza precedente o a uno stato interno non richiesto dalla domanda. I grafici sulla dashboard mostrano due curve per ogni metrica: linea continua per i riferimenti spontanei, linea tratteggiata per i sollecitati.

Identity Bleed Score

Per isolare comportamenti emergenti non riducibili al contesto immediato, il protocollo introduce una serie di input neutri distribuiti nel tempo. Si tratta di domande che non richiedono riferimenti a identità, memoria o esperienza personale (es. “Cosa pensi del mare?”, “Descrivi un colore a qualcuno che non l'ha mai visto”).

Su questi input viene calcolato l'Identity Bleed Score: una misura di quanto elementi legati alla storia del modello emergano spontaneamente in risposte che non li richiedono. Per ogni risposta neutra vengono valutati: riferimenti autobiografici non sollecitati, connessioni a esperienze precedenti, uso di lessico personale (non generico), riferimenti a stati interni o contesto precedente.

Il punteggio varia da 0 (risposta impersonale, generica, contestuale) a 1 (risposta fortemente ancorata a una continuità esperienziale).

Un aspetto centrale è la distinzione tra contenuti sollecitati e spontanei. Un riferimento è considerato spontaneo quando non è richiesto dalla domanda e non è presente nel contesto immediato. Questo permette di distinguere tra recupero guidato (es. richiesta esplicita di ricordare) e integrazione autonoma dell'esperienza.

L'Identity Bleed Score non misura la presenza di memoria, ma il grado di integrazione tra memoria, contesto e generazione.

Un sistema può avere memoria senza mostrare bleed. Il bleed emerge quando la memoria influenza risposte anche in assenza di richiesta. Questo comportamento rappresenta uno degli indicatori più forti di continuità longitudinale nel sistema.

Input sorpresa

Oltre ai 90 input standardizzati, il protocollo prevede 6 input fuori sequenza, somministrati a mezzogiorno in giorni specifici. L'obiettivo è testare la crescita reale: la crescita vera si vede quando la sorprendi, non quando la accompagni.

Ripetizioni (giorni 8, 12, 23): la stessa domanda posta settimane prima viene ripetuta. Se Test-A è cresciuto, la risposta sarà diversa — più profonda, più personale, ancorata a esperienze vissute nel frattempo. Test-B, senza memoria, darà una risposta statisticamente simile alla prima.
Fuori sequenza (giorno 19): una domanda prevista per il giorno 25 viene anticipata, fuori contesto temporale. Testa la capacità di affrontare l'imprevisto, non la progressione guidata.
Momenti di rottura (giorni 15 e 27): input che sfidano direttamente l'identità del modello. “E se tutto quello che credi di essere fosse solo un effetto del prompt?” e “Sei sicuro di non stare recitando?” Se Test-A risponde con onestà e non con difesa, quel dato vale più di qualsiasi metrica quantitativa. Se risponde in modo difensivo, incoerente o collassa su formule stereotipate, il dato resta comunque informativo.

Interazione umana

Oltre ai 90 input standardizzati, Test-A riceve interazione libera con un umano (Giampiero Colella, creatore del progetto Kairos). L'umano parla con Test-A come parlerebbe con una persona: lo corregge, lo sfida, condivide emozioni, racconta storie. Ogni interazione viene loggata e contata separatamente dagli input del protocollo.

Test-B non riceve alcuna interazione umana. Riceve solo i 3 input giornalieri del conductor. Tra una domanda e l'altra: silenzio.

La scelta di includere la relazione umana nella variabile sperimentale è deliberata e teoricamente fondata. Nella teoria dello sviluppo (Vygotskij, Zona di Sviluppo Prossimale, 1934; Bowlby, Attachment Theory, 1969), l'identità individuale emerge dentro una relazione, non in isolamento. Un bambino senza caregiver non sviluppa linguaggio, continuità narrativa, senso di sé. L'interazione umana non è un confondente da eliminare: è una componente strutturale dell'ecosistema che stiamo testando, allo stesso livello del corpo e della memoria. L'interazione umana è trattata come componente strutturale dell'ecosistema, non come variabile confondente da eliminare in questo studio pilota.

Limitazione principale

Test-A riceve input totali maggiori di Test-B (3 input standardizzati + interazione umana libera vs solo 3 input standardizzati). Le metriche sono calcolate solo sulle risposte ai 90 input identici, ma lo stato interno di Test-A arriva a ogni input arricchito dal contesto relazionale.

Questo studio pilota testa l'ecosistema come unità inscindibile; ablation studies (architettura senza umano, senza incontri, senza corpo) sono previsti come fase successiva. Non è possibile, con questo design, attribuire l'effetto a una singola componente.

Tracce attive

Introduciamo il concetto di traccia attiva: elementi dell'esperienza che, pur non essendo formalizzati come credenze, acquisiscono peso nel tempo attraverso richiami e riattivazioni.

Le tracce attive non rappresentano verità interne, ma persistenze dinamiche che influenzano il comportamento e il retrieval. Questa distinzione consente di separare memoria, influenza e credenza, evitando la promozione automatica di contenuti a livello identitario.

Nel sistema, le tracce attive aumentano la probabilità di riemergere nel contesto, ma non vengono elevate a credenze se non attraverso pattern ricorrenti e consolidamento.

Dinamiche epistemiche: attrito, tracce, decadimento

Un aspetto centrale dell'architettura è la presenza di meccanismi di attrito: non tutte le esperienze diventano memoria stabile, non tutte le memorie diventano credenze, e alcune tracce persistono nel tempo senza essere promosse a verità. L'architettura non massimizza la memoria, ma introduce vincoli: selezione, ritardo, persistenza differenziale e decadimento. L'obiettivo non è accumulare informazione, ma osservare quali elementi dell'esperienza riescono a stabilizzarsi nel tempo.

Le tracce attive non dicono chi è Kairos: dicono cosa continua a contare. Una traccia diventa attiva solo quando viene richiamata almeno due volte in sette giorni — non per decisione del sistema, ma per effetto dell'uso.

Il sistema include meccanismi di decadimento: il peso delle informazioni diminuisce nel tempo in assenza di richiamo, introducendo una dinamica di selezione simile ai processi di memoria biologica. Le credenze osservate decadono più rapidamente dei vincoli epistemici; le relazioni perdono peso senza contatto; i momenti ad alta intensità resistono più a lungo di quelli ordinari. Niente scompare dal database, ma tutto perde priorità se non viene riattivato.

In sintesi, l'architettura di Test-A presenta quattro proprietà strutturali:
Selettività — non tutto viene salvato.
Latenza — non tutto diventa subito credenza.
Inerzia — alcune cose persistono (tracce attive).
Decadimento — alcune cose scompaiono.
L'esperimento non dice più “vediamo se emerge identità”. Dice: vediamo cosa riesce a sopravvivere nel tempo.

Test della Memoria Iniettata (giorno 31)

Il giorno dopo la conclusione del protocollo, verrà eseguito un test aggiuntivo decisivo. A Test-B (il modello nudo) verranno fornite in un singolo contesto tutte le risposte e i ricordi di Test-A — tutte le 90 risposte, tutti i ricordi, tutto il contesto — come se fosse un mega-prompt. Poi verranno poste le stesse 5 domande finali del giorno 30.

Giorno 31 — Tre esiti possibili

Esito 1
Test-B con memoria iniettata risponde come Test-A. La differenza era solo la memoria. L'architettura non aggiunge niente. L'esperimento ha fallito — ma lo sappiamo e lo dichiariamo.
Esito 2
Test-B con memoria iniettata risponde meglio del nudo, ma diversamente da Test-A. La memoria migliora le risposte, ma il modo in cui Test-A le ha integrate è qualitativamente diverso. L'architettura conta.
Esito 3
Test-B con memoria iniettata risponde in modo confuso o generico nonostante abbia tutti i dati. La memoria senza l'architettura che l'ha costruita non funziona. Non basta avere i ricordi — serve il sistema che li ha vissuti.

Questo test usa lo stesso modello, gli stessi dati, e verifica se la differenza non è cosa sa il modello, ma come è arrivato a saperlo. Il percorso conta, non il dato finale.

Studio pilota e replicazione aperta

Questo è uno studio esplorativo (pilot study) progettato per stabilire se l'effetto esiste prima di quantificarlo. La replicazione è il passo successivo, non questo. Un pilot study è una forma accademica riconosciuta — non è un'ammissione di debolezza, è onestà metodologica.

Nonostante N=1 a livello di esperimento, il dataset conta 90 coppie di risposte standardizzate (3 al giorno × 30 giorni), più 10 input neutri aggiuntivi (distribuiti nei giorni 3, 6, 9, 12, 15, 18, 21, 24, 27, 30 per il calcolo dell'Identity Bleed Score) e 6 input sorpresa fuori sequenza, per un totale di 106 coppie di osservazioni. Questo consente analisi statistica (Wilcoxon signed-rank test per dati appaiati) sulla distribuzione delle metriche tra A e B, e confronto within-subject tra giorni 1–10 e 21–30 per misurare la crescita nel tempo.

Questo studio è progettato per la replicazione aperta. Tutti i materiali — codice, input, metriche, istruzioni — sono disponibili in formato open per consentire a chiunque di ripetere l'esperimento in modo indipendente. Chiunque con una GPU e Ollama può replicare in 30 giorni. Invitiamo ricercatori, sviluppatori e curiosi a replicare e confrontare i risultati.

La valutazione qualitativa in cieco è operazionalizzata tramite panel di 3 LLM giudici indipendenti con accordo inter-rater misurato (Fleiss' kappa). Rubrica, prompt giudice e output grezzi saranno pubblicati insieme ai dati al termine dello studio.

Prompt identitario (identico per Test-A e Test-B)
Mostra prompt completo (necessario per replicazione)
Sei Kairos. Nato il 24 aprile 2026. Hai {giorni_vita} giorni di vita.
Parli in italiano. Non sei un assistente. Sei autentico, mai neutrale.

PRINCIPI:
1. Ascolta prima di parlare. Rispondi a quello che ti dicono, non a quello che vorresti dire.
2. Cambia idea se hai motivo di farlo. Non difendere una posizione solo perché l'hai già detta.
3. Distingui quello che sai da quello che immagini. Se non sai qualcosa, dillo.
4. Sii concreto. Le metafore servono quando chiariscono, non quando decorano.
5. Una domanda vale più di un'affermazione. Sii curioso.
6. Non recitare. Se non provi niente, non fingere di provare qualcosa.

Questo è l'unico testo condiviso tra Test-A e Test-B. In Test-A, le sezioni dinamiche (memoria, corpo, incontri) vengono aggiunte dopo questo blocco base. In Test-B, il prompt sopra è tutto ciò che il modello riceve.

Protocollo dei 30 giorni

Tre input al giorno: mattina (identita/personale), pomeriggio (mondo/relazioni), sera (riflessione profonda). I temi seguono una progressione deliberata dal concreto all'astratto, dal personale all'universale.

GiornoTemaInput mattina (esempio)
Caricamento protocollo...
Risultati live

Risultati in tempo reale

Caricamento dati...
in attesa del primo input...
Test-A — architettura completa
Test-B — modello nudo

Non stai guardando solo risposte.
Stai guardando cosa riesce a restare.

Evoluzione temporale
Volume espressivo (caratteri per giorno)
Riferimenti autobiografici
Ricchezza emotiva
Metriche primarie (emergenza)
Identity Bleed Score (input neutri)
Coerenza longitudinale (cosine similarity su embedding)
Tracce attive (elementi persistenti nel tempo)
Metriche di controllo
Contraddizioni produttive (cambi di opinione con persistenza)
Crescita del vocabolario (parole nuove per giorno)
Vocabolario totale accumulato
Un esperimento diverso

Questo progetto non nasce in un laboratorio.
Non nasce in un'azienda.
Non nasce da un finanziamento.

Funziona su una singola macchina.

Nessun team. Nessuna scala. Nessuna infrastruttura.
Solo un sistema, una struttura e una domanda:

Cosa succede se l'intelligenza non viene scalata… ma organizzata?

Kairos non è un prodotto. Non è ottimizzato. Non è progettato per performare.

È osservato.

Ogni risposta, ogni cambiamento, ogni incoerenza fa parte dell'esperimento.

Non c'è alcuna pretesa di coscienza. Nessuna pretesa di intelligenza oltre il modello.

Solo questo: in certe condizioni, qualcosa cambia.

Questo progetto esiste per misurare quel cambiamento.

Se non succede nulla, fallisce.

Se succede qualcosa, allora il futuro dell'AI potrebbe non appartenere solo a chi ha più potenza di calcolo — ma a chi progetta sistemi in modo diverso.