le rappresentazioni distribuite - Dipartimento di Filosofia
Transcript
le rappresentazioni distribuite - Dipartimento di Filosofia
Andrea Danielli Nuove prospettive per il rappresentazioni distribuite connessionismo: le [Bozza semidefinitiva del Capitolo VI de Le forme della mente] 1 RAPPRESENTAZIONI DISTRIBUITE 1.1 Perché un capitolo sulle rappresentazioni All’interno di questo libro il filo conduttore è stato l’organizzazione del cervello, abbiamo analizzato il modo in cui l’informazione viene elaborata e, prima ancora, distribuita, immagazzinata, condivisa. Le domande guida sono state le seguenti: ci sono aree cerebrali specifiche? E, se sì, come comunicano tra loro? Come si organizzano, come gestiscono memoria e novità? Abbiamo affrontato gli approcci classici, modularismo e connessionismo; abbiamo indagato gli studi promettenti sulla sincronizzazione. Perché ora parlo di rappresentazioni? E, soprattutto, perché sono «distribuite»? A mio avviso il concetto di rappresentazione ha due motivi di interesse: il primo, campanilistico (sono un filosofo) sta nell’essere un concetto dalla lunga tradizione filosofica, il secondo, neuroscientifico, sta nell’essere in grado di rispondere alle esigenze di comprensione su memoria, elaborazione e comunicazione. Infatti, non lo nascondo, auspico che questo capitolo possa essere un tentativo di gettare un ponte tra filosofia e neuroscienze. Penso che la mia trattazione possa inserirsi all’interno della tradizione connessionista, anche se intendo conservare la dimensione simbolica del mentale, proprio impiegando il concetto di rappresentazione distribuita. 1.2 Struttura del capitolo Nella parte iniziale del capitolo dedico la mia attenzione al concetto di rappresentazione, dando una rapida panoramica della sua trattazione nella filosofia della mente attuale; propongo poi una mia definizione, con riferimenti neuroscientifici, che possa agganciare la rappresentazione alla base neurale che la produce. Infatti nelle mie intenzioni la rappresentazione è l’unità di informazione che si scambiano le diverse aree cerebrali nello svolgimento delle funzioni cognitive superiori; grazie ad alcune sue caratteristiche, che vedremo in dettaglio in seguito, è in grado di organizzare l’elaborazione dell’informazione. Nel cuore del capitolo propongo un modello che, spero, possa spiegare alcune modalità di apprendimento mediante l’associazione di rappresentazioni di modalità diverse, concentrandomi in particolar modo sulla funzione che potrebbero svolgere le rappresentazioni fonologiche. La parte finale è dedicata ad ampliare la portata del modello ed a commentarne problemi e difficoltà teoriche. Cerco di seguire una linea espositiva che accompagni il lettore, introducendolo prima alla materia, poi rendendolo consapevole dei problemi e proponendo un percorso che ci avvicini 1 alla soluzione. Una volta raggiunta la soluzione, ne descrivo le caratteristiche prima in astratto, poi con esempi e casi concreti. Ho tentato di costruire un capitolo in cui il livello di difficoltà aumenti progressivamente: la parte Un ultimo sforzo, equilibri e dinamiche, quasi un’appendice, per quanto concettualmente impervia è fondamentale per dare completezza alla mia argomentazione. 1. 3 Rappresentazioni e concetti: che cosa sono? Del termine «rappresentazione» esistono molte definizioni; esaurirne la storia, soprattutto filosofica, sarebbe eccessivo. Perciò ne propongo due che hanno il pregio di essere semplici e sufficientemente generali: «ogni attività percettiva che porta al riconoscimento, all’identificazione o alla denominazione necessita dell’attivazione di rappresentazioni immagazzinate in memoria» [Houdé et al., 1998; trad. it. 2000]. «Una rappresentazione può essere ogni oggetto o stato fisico che è prodotto in qualche modo per stare al posto di qualche altro oggetto o stato fisico (o una disgiunzione estremamente complessa di stati o oggetti – includente oggetti astratti, quali i numeri)»1. Date queste definizioni preliminari ora occorre capire che significato abbiano all’interno dei problemi che abbiamo fin qui affrontato. Una rappresentazione è un’entità mentale che ha la funzione di riprodurre gli oggetti, le relazioni e le proprietà della realtà esterna; la rappresentazione di un tavolo «sta per» il tavolo, ma non solo: si offre ad una serie di operazioni mentali rese possibili dal suo possedere proprietà semantiche2. Significa cioè che il soggetto può disporre della rappresentazione per combinarla con altre rappresentazioni, o per derivarne altre, nel ragionamento e nella comunicazione, ad esempio. Per capire meglio questo punto occorre riflettere sul fatto che di «tavolo» possiamo avere diverse rappresentazioni: il suono della parola «tavolo», l’immagine visiva, il concetto di tavolo. Ognuna di queste rappresentazioni può servire ad una funzione diversa: il suono ed il concetto per parlare, per derivare, ad esempio, la rappresentazione di una sedia, mentre l’immagine può essere utile per costruire un nuovo tavolo o per muoversi in una stanza al buio. Uno dei più difficili ambiti di indagine riguarda le relazioni che intercorrono tra rappresentazioni e oggetti della rappresentazione. In questo capitolo non posso occuparmi di un problema così complesso: cerco di affrontare le rappresentazioni trattandole come degli oggetti creati da aggregati neurali e le cui dinamiche possono essere studiate secondo una logica biologica; per questo motivo la definizione che presento ora cerca di riferirsi specialmente al soggetto ed alla sua intuizione, evitando le relazioni rappresentazione-mondo3. 1.4 Il significato nel capitolo Per capire il modo in cui il termine verrà usato nel capitolo propongo ora una mia definizione di rappresentazione: «una rappresentazione è la minima unità cognitiva funzionale costituita da una popolazione neurale organizzata secondo patterns spaziotemporali specifici e caratterizzati da bassa variabilità»4. Minima unità cognitiva funzionale 2 Parlare di «minima unità cognitiva funzionale» ci pone immediatamente numerose difficoltà che non posso nascondere: siamo di nuovo di fronte al problema di spezzare la mente, di imporre una nostra logica ad un sistema che non sappiamo bene come funzioni. È ben difficile parlare di massimo e minimo quando si ha a che fare con piani diversi che si intersechino secondo modalità ignote e, quando, come vedremo in seguito, ci troviamo di fronte ad una logica combinatoria. Pezzetti che si combinano per dare vita a pezzi più grandi che poi si combinano tra loro. Come chiamare i pezzi di ogni livello? Per me è facile parlare di rappresentazioni audio e video, dato che sono riccamente trattate in letteratura e si prestano ad una comprensione intuitiva; il mio lavoro concernerà soprattutto queste due modalità. Per questo parlo di «unità cognitiva»: perché il metro di giudizio dell’unità è la nostra coscienza: ciò che vediamo unico e completo mentre percepiamo o ragioniamo è una rappresentazione: ad esempio la parola «musica» o l’immagine di una chitarra; non è una rappresentazione un insieme di suoni privi di significato5, o un insieme di macchie di colore da cui non sia possibile risalire all’oggetto rappresentato. Naturalmente, ne sono consapevole, una simile interpretazione esclude l’analisi dei sistemi motori: non essendo coscienti le memorie dei movimenti è ben difficile decidere dove e come scomporre le nostre azioni6. Possiamo comunque dedurre dalla mia definizione che una rappresentazione può essere scomposta in costituenti più elementari, da un punto di vista strutturale: un’immagine può essere formata dal contributo di gruppi neurali che si occupano di colori, altri che si occupano di linee verticali, altri di linee orizzontali7. Come chiamare e scoprire questi microgruppi resta a mio avviso ancora problematico. Patterns spaziotemporali specifici I raggruppamenti che danno vita alle rappresentazioni si costituiscono mediante la coordinazione dei patterns di scarica dei neuroni. Per dare un’idea molto intuitiva, pensiamo ai patterns di scarica come a delle equazioni che, su un piano cartesiano, sono usate per descrivere figure. Bassa variabilità La formazione di un raggruppamento che dà luogo ad una rappresentazione deve avvenire con una bassa percentuale di variazioni: ciò significa che possono non attivarsi tutti i neuroni (ricordiamoci che abbiamo a che fare con decine di milioni di neuroni, o più, non sono disponibili stime a riguardo), ma ciò non dovrà menomare la rappresentazione. Se invece la variabilità è superiore ci troveremo con una diversa rappresentazione, avrà luogo una sorta di salto8. 1. 5 Spiegazioni terminologiche Nella mia analisi mi riferirò al termine generale «rappresentazione» e non mi occuperò di quello che considero un sottoinsieme: il «concetto». Infatti il 3 termine concetto è specifico, riferito al linguaggio e, soprattutto, ha un’enorme tradizione filosofica che rende complessa la sua trattazione. La terminologia in questo capitolo sarà fonte continua di problemi: infatti spunteranno altre due parole spinose: simbolo e qualia. Con simbolo restiamo ancora nella definizione di rappresentazione: un simbolo è un qualcosa che rimanda ad un'altra cosa tramite delle relazioni di analogia e somiglianza (per esempio la bilancia che simbolizza la giustizia). I qualia, concetto più che mai problematico in filosofia della mente, sono solitamente considerati gli «stati qualitativi dell’esperienza cosciente». Una definizione meno banale forse non è possibile, meglio usare degli esempi: il rosso di un’immagine, il dolore che provo per una ferita, il suono delle parole, sono tutti qualia (quale al singolare). Ciò che penso sia importante mettere in luce, per distinguere meglio dal simbolo, è che un quale non rimanda ad un oggetto in virtù di un’analogia o somiglianza: innanzitutto il quale non è un oggetto; non ha un contenuto semantico, immediatamente spendibile. È ad un livello più basso, costitutivo, è la «materia» con cui costruiamo i nostri pensieri9. Infatti se penso alle parole queste eccheggiano nella mia mente come suoni (più in là parlerò di codifica fonologica): se penso ad una parola astratta, «intelligenza», sento nella mia testa una voce (sempre la solita) che dice «intelligenza». Se penso a simboli avrò nella mia mente delle immagini colorate. Non intendo affrontare spinose riflessioni sui qualia, sulla loro origine e sulle relazioni tra qualia e attività mentale. Occorrerebbe molto spazio. Il mio punto di vista si pone però come antineutrale: significa che cercherò di fare una trattazione minimale e basata unicamente su ciò che risulta praticamente indiscutibile10. 1.6 Un excursus, fondamentale Come abbiamo già visto nel capitolo I sul confronto tra modularismo e connessionismo, il connessionismo viene considerato un approccio «subsimbolico» allo studio del mentale; è nato in opposizione all’Intelligenza Artificiale classica, simbolica, e a lungo questo suo aspetto sub-simbolico non ha pesato sul suo sviluppo. Eppure pensare che il cervello sia un’unica enorme rete neurale si scontra con il fatto che tutto il nostro ragionamento sembra essere simbolico. Ragioniamo usando parole, sentendo dentro di noi un dialogo quasi ininterrotto. Il ragionamento discorsivo (ma anche quello matematico) sembra avere alla base un comportamento ordinato da regole; la teoria computazionale del mentale, che ha origine nei lavori pioneristici di Turing [1950] e che a lungo ha influenzato filosofia della mente e psicologia, considera il pensiero come il prodotto di operazioni (secondo regole) svolte su simboli; la concezione chomskiana, quasi un paradigma, vede nella sintassi la base del linguaggio. Riuscire ad ottenere in una rete neurale un comportamento governato da regole che agiscono su simboli è ancora difficile11. Delle reti neurali sappiamo solo gli input e gli output; non possiamo vedere al loro interno nulla, se non i pesi dei neuroni artificiali, ma da questi è difficile riconoscere simboli e regole. Cercherò di proporre in questo capitolo una soluzione che sia capace di conciliare connessionismo e simboli: cercherò di spiegare in che modo l’enorme rete di neuroni dia luogo a rappresentazioni e, soprattutto, come sia possibile memorizzare l’immenso numero di rappresentazioni che possediamo in memoria. Riprendo quindi la mia definizione di rappresentazione; tale definizione, parlando di popolazione neurale, è già adeguata per le rappresentazioni distribuite. 4 Per spiegare meglio il concetto mi servirò di una metafora: pensiamo alle coreografie realizzate allo stadio: ogni tifoso è un neurone; per realizzare una scritta si attivano migliaia di tifosi, ognuno dei quali ha in mano di solito un cartoncino colorato. Da solo un tifoso non può mandare alcun messaggio. La coreografia (la rappresentazione) è possibile solo se tutti i tifosi collaborano nello stesso momento, non se alcuni alzano il cartoncino in momenti diversi. Quando ricordiamo un’immagine nel cervello si attiveranno numerosi raggruppamenti, ognuno dei quali andrà a costituire un pezzetto dell’immagine; gli aggregati neurali coinvolti possono anche essere spazialmente separati, o, mi spiego meglio, possono darsi microraggruppamenti collegati tra loro mediante pochi neuroni (pensiamo alle macchie sulla pelliccia del dalmata collegate da dei fili molto sottili). Inoltre possono essere su più livelli di elaborazione12. Un altro fattore fondamentale delle rappresentazioni distribuite è la loro origine combinatoria: un neurone partecipa alla formazione di diverse rappresentazioni; il suo contributo dipende dai «compagni», dagli altri neuroni che stanno collaborando con lui. Secondariamente, penso che le qualità specifiche possano essere codificate da gruppi che si combinano per dare vita alle rappresentazioni: per esempio una parola è formata da fonemi. Ogni fonema è il prodotto caratteristico di un raggrupamento neurale. Per costruire parole diverse si attiveranno in diverso ordine i gruppi-fonemi richiesti dalla parola. «Gatto» e «matto» comporteranno l’attivazione di gran parte degli stessi raggruppamenti neurali. Ritornando alla metafora della coreografia allo stadio: se i tifosi si accordano13 per alzare il proprio cartoncino in momenti diversi potranno dare vita a scritte diverse. Diventa quindi molto importante la dimensione temporale. Una volta che abbiamo capito che cosa sia una rappresentazione distribuita siamo pronti per affrontare i problemi che comporta: capire come si organizzano i raggruppamenti e come si memorizzano (e riattualizzano). Nelle parole precise di Singer [1998, 1831]: Nella codifica ad opera di aggregati neurali devono essere soddisfatti due importanti requisiti. Primo, è richiesto un meccanismo di selezione che permetta una associazione di neuroni dinamica e al tempo stesso duratura all’interno di aggregati funzionalmente coerenti [aventi la stessa funzione]. Secondo, le risposte dei neuroni che sono stati identificati come raggruppabili devono essere etichettate così che possano essere riconosciute da livelli di elaborazione successivi come legate tra loro14. Dobbiamo dare vita a gruppi distinti e coerenti combinando correttamente i sottocomponenti. Se siamo in uno spazio bidimensionale possiamo risolvere il problema introducendo una terza dimensione. Agiamo dalla terza dimensione per spostare e ordinare le figure bidimensionali e dare vita a figure più complicate. Dato che nel cervello siamo in tre dimensioni come possiamo comportarci? Utilizziamo la quarta dimensione, il tempo. In effetti, come anticipato nella metafora dello stadio, se diciamo ai tifosi di alzare i loro cartoncini in momenti diversi possiamo ottenere diverse scritte (magari le lettere saranno distanti, ma non badiamo troppo alla precisione!). Penso che il modo in cui i neuroni si scambiano i tempi di attivazione possa essere legato ai patterns di scarica; i patterns di scarica sono costituiti dalle scariche dei neuroni e dalle pause tra di esse. Non diversamente da un codice morse, per intenderci. 5 2 ENTRANDO NEL MODELLO Come si ricorderà, si pongono principalmente due problemi per chi voglia sostenere una teoria sulle rappresentazioni distribuite: il primo consiste nel riuscire a distinguere i diversi raggruppamenti, il secondo nel memorizzare questi raggruppamenti. Il primo problema dipende dal fatto che una rappresentazione è costituita dalla combinazione di diversi raggruppamenti neurali15. Il secondo problema discende dalla logica combinatoria: dove si può memorizzare una combinazione? In che modo? Come fa l’area cerebrale a «sapere» come riorganizzarsi ogni volta? 2.1 I codici impliciti La lettura di questi passaggi mi ha aiutato ad avviarmi verso la soluzione che presento in questo capitolo: Secondo questo insieme di teorie, la memoria visiva a lungo termine delle forme è immagazzinata in un codice astratto nel lobo temporale inferiore. Per lo meno nel cervello delle scimmie, questa memoria è immagazzinata usando un codice popolazionale; (…) l’attivazione in gruppi di colonne – non sequenze di attivazione in aree organizzate topograficamente – specifica la forma. […] la geometria locale delle forme è solo implicita nella rappresentazione della memoria a lungo termine (LTM), ed è resa esplicita generando patterns16 di attivazione nella corteccia visiva primaria, topograficamente organizzata17 [Kosslyn, Thompson 2003, 724-5]. Quello che ho trovato interessante, e che sottolineo, è l’idea di codice astratto; il codice astratto viene memorizzato in una popolazione di neuroni; l’attivazione di questa popolazione dà vita ad una rappresentazione distribuita mediante l’impiego di patterns di scarica. Penso che una possibile soluzione ai problemi sopracitati sia in queste righe: i patterns di attivazione servono per ricostruire con precisione la rappresentazione combinatoria, il codice che conserva la combinazione è contenuto in un’altra area rispetto a dove avrà luogo la combinazione. Penso che sia questo il passaggio fondamentale. Dividere l’area che conserva l’informazione dall’area su cui quell’informazione agisce permette di organizzare i complicati raggruppamenti neurali che sottendono una rappresentazione; riprenderò la metafora della coreografia allo stadio per rendere comprensibili le difficoltà che dobbiamo risolvere. Immaginate che i tifosi non abbiano diviso prima lo stadio in zone precise e distribuito i cartoncini colorati, e che debbano accordarsi tra loro al momento per dar vita alla coreografia. Migliaia di tifosi che si passano i cartoncini cercando di capire quello che fanno i vicini, ma senza poter vedere da lontano la scritta o l’immagine a cui cercano di dare vita. Credo sia impossibile che riescano a trovare un equilibrio e, soprattutto, che riescano a dare vita ad una qualsiasi rappresentazione dotata di senso. Immaginiamo invece che sia possibile ad un tifoso di vedere la curva dall’alto, e che possa, magari gridando, comunicare ai tifosi come organizzarsi. Abbiamo una forma astratta della rappresentazione (mediante un codice diverso), infatti il tifoso «privilegiato» comunicherà tramite parole, non colori. E sarà abbastanza facile memorizzare le istruzioni che darà. Guidati in questo modo, i tifosi saranno in grado di distribuirsi i cartoncini e dare vita a rappresentazioni complesse e 6 precise18. La necessità di un codice astratto oltre che in Kosslyn, viene evidenziata da Chalmers [1990, 54]: Van Gelder ha espresso questa distinzione notando che l’implementazione connessionista di strutture composizionali ha impiegato una «composizionalità funzionale», piuttosto che la «composizionalità concatenativa» che è stata impiegata in approcci di intelligenza artificiale più tradizionali. La composizionalità funzionale è raggiunta con l’uso di funzioni (possibilmente di una certa complessità) che operano su esemplari [tokens] simbolici, e producono una rappresentazione codificata di una struttura composizionale complessa. Questi modelli differiscono dai modelli simbolici nel fatto che la rappresentazione composizionale non richiede di contenere espliciti esemplari [tokens]19 fisici dei costituenti originali, ma possa invece contenere solamente l’informazione originale in una modalità davvero implicita20. 2.2 Il modello Come posso quindi riassumere le diverse idee che fin qui ho discusso, le rappresentazioni distribuite, il codice astratto, le combinazioni? Do una prima formulazione della mia proposta, la amplierò e chiarirò strada facendo: a) una rappresentazione distribuita si realizza mediante la compartecipazione di diversi sottogruppi di neuroni, ognuno dei quali codifica all’incirca una qualità (se siamo in una corteccia visiva ogni sottogruppo si occuperà, per esempio, di colori precisi: chi del rosso, chi del giallo, etc.); b) la memoria di una rappresentazione distribuita sta in un altro raggruppamento neurale legato tramite aree associative multimodali21; c) l’apprendimento si ottiene associando nuove rappresentazioni a rappresentazioni già possedute; d) nel passaggio attraverso aree associative multimodali si ottiene la condensazione e la realizzazione di un codice astratto; siamo di fronte all’azione di principi gerarchici; e) la codifica si ha mediante patterns di scarica. 2.2.1 Aree associative multimodali Avendo già analizzato e spiegato che cosa sia una rappresentazione distribuita intendo occuparmi del punto b, presentando delle riflessioni sulle aree associative multimodali seguite da un esempio concreto di associazione multimodale. Interazioni multimodali «L’esperienza quotidiana ha luogo in modalità multiple. La formazione di un registro duraturo dell’esperienza, e la sua incorporazione associativa nella (pre)esistente base di conoscenza, necessita l’integrazione multimodale»22 [Mesulam 1998, 1024]. Per Mesulam l’apprendimento richiede interazioni multimodali. Cercherò di mostrare in che modo questo apprendimento possa avere luogo. Ma, anticipo fin da ora, le cortecce associative multimodali non sono dei depositi di memoria multimodale, bensì solo delle aree di collegamento e 7 comunicazione: «le aree transmodali non sono necessariamente centri dove risiede una conoscenza convergente, ma passaggi (o centri, canali, connessioni) per accedere alla appropriata informazione distribuita»23 [Mesulam 1998, 1024]. La memoria vera e propria deve essere nelle aree unimodali. Come vedremo, la memoria di una rappresentazione deve essere in un’altra rappresentazione. Un esempio di associazione multimodale Il motivo per cui mi interesso di associazioni multimodali sta nell’importanza che attribuisco alla codifica fonologica, a quello cioè che percepiamo come un pervasivo dialogo interiore. Infatti le mie ricerche sono cominciate dal notare come tutto il nostro ragionamento passi per parole; più precisamente, passi per i suoni che hanno queste parole. Mi sono domandato se questa non sia una semplice combinazione, e se il fonologico non abbia in effetti la funzione privilegiata di organizzare gran parte delle rappresentazioni mentali. Anche la teoria sviluppata da Dehaene per spiegare il ragionamento matematico attribuisce una certa importanza alla codifica fonologica: insieme ad aree non linguistiche deputate alla quantificazione e manipolazione di grandezze esistono aree che mostrano caratteristiche verbali laddove siano richieste conoscenze matematiche esatte24. Tutta una serie di teorie sulla memoria a breve termine attribuiscono notevole importanza all’operazione di codifica fonologica: penso a Baddeley [1996] e Vallar [2006]. La memoria a breve termine si serve di una codifica fonologica: «il soggetto deve prima tradurre le rappresentazioni visive della lettera nelle loro rappresentazioni fonologiche corrispondenti (i nomi delle lettere)»25 [Smith 1998, 12063]. Non potrebbe essere dovuto al fatto che il fonologico organizza le rappresentazioni nuove prima che avvenga l’effettivo apprendimento (proprio permettendone la combinazione)? Per poter immagazzinare nella memoria a lungo termine le nuove rappresentazioni occorre un periodo di ripetizione (rehearsal); interpreto tale periodo di ripetizione come un momento necessario affinchè le diverse combinazioni possano trovare prima un loro equilibrio e poi associarsi: in effetti le associazioni devono avvenire tra sistemi stabilizzati perché possano dar vita a risultati durevoli (si capirà meglio in seguito, si veda: Un ultimo sforzo: equilibri e dinamiche). Se pensiamo poi a tutto l’apprendimento concettuale, questo è vincolato alla codifica fonologica. Nel passaggio seguente si citano poi degli studi che evidenziano la traduzione degli stimoli visivi in rappresentazioni fonologiche. Nella mia proposta mi occupo di associazioni tra rappresentazioni visive e fonologiche. Questo suggerisce la possibilità che l’area parietale di interesse possa essere attivata nei nostri studi di neuroimmagine perché è parte del circuito interessato nella traduzioni del materiale verbale presentato visivamente in un codice fonologico, e in seguito l’area semplicemente rimane attiva per qualche secondo, e questa persistenza della attività costituisce la pura funzione di immagazzinamento della Memoria di Lavoro verbale26 [Smith 1998, 12063]. 8 Occorre poi ricordare alcuni importanti studi citati da Friston et al. [1996] che sembrano davvero promettenti, infatti evidenziano delle forti relazioni tra aree deputate al riconoscimento di oggetti e circuito fonologico: «[…] l’attivazione nell’area inferotemporale, dovuta al riconoscimento di oggetti, veniva profondamente modulata dal recupero fonologico del nome dell’oggetto»27. Studiare quindi le relazioni multimodali può essere molto interessante per capire l’organizzazione dell’informazione nel cervello. E, inoltre, spero possa essere utile a capire le relazioni tra pensiero (costituito soprattutto da rappresentazioni fonologiche) e sua base neurobiologica (le popolazioni di neuroni sottese alle rappresentazioni). 2.2.2 Associazione di nuove rappresentazioni a vecchie rappresentazioni Una rappresentazione nuova è costituita dall’associazione, secondo nuove modalità di combinazione, di sottogruppi già noti. Mediante l’associazione di questa rappresentazione ad un’altra rappresentazione si creano dei percorsi all’interno delle aree associative multimodali; «l’apprendimento di un nuovo input consiste nel selezionare e rinforzare un gruppo (o più gruppi) appropriato che risuona28 con l’input»29 [Izhikevich 2006, 270]. Nella prima parte della citazione abbiamo la formazione della rappresentazione: un gruppo (o più gruppi) risuonano con l’input. Io sarei favorevole ad una dinamica compositiva tra più gruppi, ognuno dei quali codifica una qualità (feature), della rappresentazione unitaria; questo per motivi di economia e sulla base di dati neuroscientifici favorevoli a raggruppamenti locali aventi qualità simili (rimando alla citazione precedente di McIntosh [2000], pag 6). Le stesse parole di Izhikevich sostengono la logica combinatoria: «assegnare la rappresentazione (il significato) al gruppo consiste nel potenziare le connessioni deboli che collegano questo gruppo con altri gruppi co-attivi nello stesso tempo, ossia, inserire il gruppo nel contesto di altri gruppi che hanno già (delle) rappresentazioni»30 [Izhikevich 2006, 270]. Io non penso che una rappresentazione derivi il suo «significato» (qualunque cosa voglia dire; parlerei più di unicità) solo dal legame con altre più antiche: piuttosto il significato deriva dalla combinazione dei suoi costituenti, ed è, quindi, intrinseco31. Ma quello che mi interessa cogliere da questa citazione è il potenziamento delle connessioni tra gruppi co-attivi: nella mia ipotesi siamo tra relazioni multimodali. Credo di dover reinterpretare un po’ l’idea di Izhikevich. Innanzitutto propongo di immaginare che la rappresentazione sia formata da più gruppi; secondariamente, l’apprendimento di una nuova rappresentazione non si ha, a mio avviso, mediante l’irrobustimento delle connessioni tra gruppi costituenti. Piuttosto penso si abbia nella memorizzazione delle combinazioni in un’altra area rispetto a dove hanno luogo. Ho paura in effetti che l’irrobustimento potrebbe portare, a livello locale (e unimodale), ad un’eccessiva connettività che renderebbe difficile fare discriminazioni tra rappresentazioni diverse. 2.2.3 Produzione di un codice astratto Propongo che la costruzione della rappresentazione dia luogo ad un codice implicito, astratto, che, legandosi ad una rappresentazione coattiva, permette la 9 memorizzazione della combinazione. Ad ogni livello di elaborazione cambia notevolmente il valore dei patterns prodotti; salendo verso aree più complesse e di integrazione i patterns riporteranno le relazioni tra gruppi, non solo all’interno di gruppi. Studi sui processi all’origine della percezione visiva sembrano sostenere questa idea, ad esempio Tanaka [1996, 120] sottolinea la presenza di vari livelli di selettività: Le aree TEO e V4 sono state quindi caratterizzate dalla mistura di cellule con vari livelli di selettività. Possiamo considerare questa mistura di varie cellule come un’evidenza del fatto che la selettività è costruita attraverso reti locali in queste regioni. Se campioniamo cellule da una rete locale in cui le risposte selettive a caratteristiche complesse sono costruite integrando caratteristiche semplici, il campione dovrebbe includere cellule con diversi livelli di selettività. Cellule situate vicino agli input dovrebbero essere attivate massimamente da caratteristiche semplici, cellule vicine agli output dovrebbero rispondere solo a caratteristiche complesse, e cellule ai livelli intermedi dovrebbero mostrare caratteristiche intermedie. Le aree che soddisfano queste condizioni sono state TEO e V432. Per capire l’astrattezza del codice, penso possa essere utile anche questa citazione: «[…] una memoria non è una rappresentazione, ma rispecchia il modo in cui il cervello ha modificato la propria dinamica per consentire la ripetizione di una prestazione» [Edelman, Tononi 2000, 113]. Per quanto a tutta prima possa sembrare contraddittorio con quanto da me sostenuto, in realtà aiuta a chiarire meglio il mio punto di vista. La memoria di una rappresentazione A sta infatti nel legame con un’altra rappresentazione B che sia capace di riattivare le dinamiche compositive che sottendono A. Come conseguenza deriviamo che un codice implicito ha senso solamente se viene interpretato da qualche rappresentazione, non in sé stesso. 2.2.4 La codifica avviene mediante patterns di scarica Il recupero di una rappresentazione sarà ottenuto inviando un codice capace di far risuonare i raggrupamenti costitutivi. In questa citazione di Izhikevich [2006, 26] penso che la parola input possa essere interpretata anche come codice (basta che l’input provenga da altre aree della corteccia, invece che da organi di senso): «[…] ogni volta che l’input è presentato al network, un gruppo (o più gruppi) policronico il cui patterns di scarica risuona con l’input è attivato (cioè, i neuroni che costituiscono il gruppo policronizzano)»33. 2.3 Il modello, nel concreto Devo partire da una breve puntualizzazione. Una rappresentazione non è subito la memoria dell’altra. Il compito di memorizzare una rappresentazione unimodale viene inizialmente svolto dall’ippocampo in combinazione con la corteccia. Le rappresentazioni contenute nella corteccia si associano tra loro nel tempo, mentre l’ippocampo perde le tracce mnestiche. Il modo in cui presento il modello non tiene conto della dimensione temporale, o, meglio, rende istantanei fenomeni che richiedono del tempo. Questo perché, allo stato attuale delle conoscenze, sarebbe molto difficile spiegare questi fenomeni correttamente. 10 Facendo una rapida riflessione sulle relazioni tra rappresentazioni che possa essere interessante studiare ne identifico almeno tre casi: apprendimento di due rappresentazioni sconosciute, apprendimento di una sconosciuta associata ad una nota, recupero di una rappresentazione mediante la rievocazione di quella più semplice. Parliamo del primo caso, apprendimento di due nuove rappresentazioni, con esempi concreti. Una nuova immagine (la foto di una sogliola) viene presentata al soggetto; nelle aree occipitali34 (dove si processano le informazioni visive) si crea una rappresentazione visiva topografica35 che rappresenta l’immagine (vediamo la sogliola). Ad un livello superiore di elaborazione, laddove avviene il riconoscimento degli oggetti, hanno probabilmente luogo delle dinamiche scompositive: la rappresentazione topografica si trasforma in un insieme di elementi costitutivi più semplici36. Per esempio la sogliola potrebbe scomporsi in un triangolo per il «muso», un rettangolo per il corpo, altri due triangoli per la parte finale e la coda. L’insieme dei patterns di scarica prodotti da ogni elemento costituisce la rappresentazione astratta dell’oggetto. Probabilmente è questa rappresentazione astratta, non quella topografica, che si combina con quella fonologica. Nel frattempo l’immagine presentata ha un nome: «sogliola». Nelle cortecce uditive si combineranno diversi fonemi per dare vita alla rappresentazione corrispondente a «sogliola». Abbiamo così che nelle cortecce unimodali si sono formate delle rappresentazioni unimodali: una volta che hanno raggiunto l’equilibrio37 mandano dei patterns costanti verso le cortecce associative. Nelle cortecce associative si incroceranno i patterns costanti provenienti dalle due rappresentazioni formate; si irrobustiranno le sinapsi e i percorsi associativi impiegati per mettere in comunicazione le due rappresentazioni. Perché si creino dei percorsi associativi occorre che le sinapsi siano attivate con una certa frequenza, più volte e ravvicinatamente38. Questo richiede che le due rappresentazioni si mandino più volte lo stesso segnale per permettere simili ripetizioni. Lo stesso meccanismo si avrà di fronte ad una rappresentazione ignota che si associa ad una nota: comunque sia si organizzeranno le popolazioni neurali e, raggiunta la stabilità, si associeranno tra loro le rappresentazioni presenti contemporaneamente. Quando ci si trova di fronte ad un compito di recupero di una rappresentazione in memoria penso agisca il seguente meccanismo: si crea prima una rappresentazione di più facile accesso (penso sia solitamente di carattere fonologico), mediante quello che sperimentiamo come ragionamento, o dialogo interiore. La sua attivazione darà luogo all’emissione di patterns caratteristici. Questi attraverseranno le cortecce associative multimodali e riattiveranno l’immagine, per quanto complessa e frutto di molte combinazioni, che era associata al nome. Il principio dovrebbe essere quello della «risonanza» proposto da Izhikevich39. Occorre però fermarci un istante. L’operazione di creazione di una rappresentazione a partire da un’altra non è semplice e, a mio avviso, c’è una certa differenza tra un codice prodotto da un sistema in equilibrio e il codice che serve per dare vita alle combinazioni prima dell’equilibrio. Torniamo al nostro consueto esempio: se portiamo una foto di come appare la corografia da un elicottero non saremo immediatamente in grado di convertirla in un insieme di istruzioni da dare ai tifosi su come organizzarsi. Però, è evidente, sapremo cosa vogliamo ottenere e potremo correggere velocemente i tentativi di organizzazione che i tifosi tenteranno. Sono comunque abbastanza convinto che il recupero impieghi più 11 rappresentazioni associate che guidano la costruzione della rappresentazione da recuperare. In questo modo ci sono maggiori probabilità di dare vita al codice implicito «giusto», se questo nasce in più aree. Questo potrebbe essere uno dei motivi che spiega la maggiore attivazione di aree cerebrali in compiti di recupero rispetto all’attivazione durante l’apprendimento [cfr. Nyberg 1996, 11284]; inoltre si spiega il fatto che il recupero sia sottoposto ad una variabilità abbastanza elevata, soprattutto di fronte ad immagini. 2.4 Un modello simile: la teoria SOC Ho avuto poi modo di incontrare un modello che ritengo possa avere alcune affinità con il mio. Lo cito perché gli autori presentano molte riflessioni e dati sperimentali che possono arricchire la mia proposta. In effetti nella teoria SOC (Self Organizing Consciousness40) di Perruchet e Vinter il ruolo delle rappresentazioni coscienti è decisivo: «la vita mentale è assunta essere coestensiva con la coscienza»41. Fin dalla definizione di rappresentazione è possibile annoverare delle analogie: «la parola rappresentazione designa un evento mentale che presuppone il ruolo di alcuni componenti significativi del mondo rappresentato (ad esempio una persona, un oggetto, un movimento, una scena) all'interno del mondo rappresentante»42. La teoria SOC propone che il cervello si auto-organizzi utilizzando le rappresentazioni coscienti come unità fondamentali: «il nostro approccio consiste nel mostrare come un largo numero di fenomeni che sembrano richiedere processi basati su regole di astrazione inconsce, inferenze, analisi, ed altre operazioni implicite complesse, possano essere descritti dalla formazione di rappresentazioni conscie che sono isomorfe alla struttura del mondo»43. L’apprendimento si spiega secondo principi associativi: «il punto centrale è che ogni esperienza conscia innesca meccanismi di apprendimento associativo che prendono come componenti questa esperienza come ‘materiale’ su cui operare»44. L’associazione comprende rappresentazioni di complessità variabile, originate secondo una dinamica combinatoria: «[…] la rappresentazione di eventi esterni può essere abbastanza complessa. […] possono essere rappresentazioni di combinazioni o configurazioni di stimoli elementari»45. La differenza tra il modello SOC e la mia proposta sta in gran parte nell’origine dei dati e nei diversi argomenti portati a supporto: il loro lavoro si basa su dati psicologici (il fenomeno della «diminuzione del trasferimento») e sul successo di un programma di estrazione parole basato sul modello; il mio porta soprattutto considerazioni basate sui codici popolazionali, e sulla dinamica cerebrale (sincronizzazione o policronizzazione). Certamente i due modelli sono integrabili senza difficoltà, e possono essere utili per una diversa concezione delle rappresentazioni all’interno della filosofia della mente. 2.5 Metarappresentazioni e sistemi di molte rappresentazioni Sarebbe tuttavia semplicistico pensare di esaurire l’enorme complessità di comportamento e le grandi capacità elaborative del cervello nel solo modello associativo intermodale fin qui proposto. Per prima cosa occorre pensare che un 12 sistema che funzioni associando tra loro rappresentazioni prodotte combinando parti più semplici potrebbe facilmente dar luogo a metarappresentazioni: all’interno di una modalità, oppure multimodali. L’associazione di due o più rappresentazioni può essere organizzata aggiungendo ad esse un’ulteriore rappresentazione che ne conservi i codici e sia in grado di riattivare, magari in una precisa sequenza temporale, le rappresentazioni che ne dipendono. Una rappresentazione come la parola «più» (intesa come somma) può essere usata per organizzare rappresentazioni come le parole «uno», «due» (etc). Secondariamente, penso sia lecito immaginare che esistano delle combinazioni multiple: per esempio, perché si attivi una rappresentazione è necessario che si attivino prima altre due rappresentazioni. Per ricordare il volto di mia nonna Maria occorre che si attivino prima le due rappresentazioni fonologiche «nonna» e «Maria». Se si attivasse solo la prima non sarei in grado di estrarre un’informazione sufficientemente precisa. 3 UN ULTIMO SFORZO: EQUILIBRI E DINAMICHE Ho già introdotto il discorso sulla stabilità degli aggregati. Non sono entrato più di tanto nei dettagli. L’idea intuitiva che c’era alla base è molto semplice: non ha senso associare tra loro degli insiemi disordinati: non possiamo associare due puzzle incompleti. In questa sezione purtroppo sarò costretto a dare molte conoscenze per scontate; decisamente è la parte più difficile del capitolo. Mi scuso subito se alcune parti sembreranno incomprensibili. Come ripeto ora, per la mia proposta è fondamentale che i due aggregati che si associano siano stabili per il tempo necessario all’associazione. Alcune considerazioni di importanti neuroscienziati rimarcano questo fatto: «per poter prendere delle decisioni sulla base di una rappresentazione (basata su qualia), la rappresentazione deve esistere abbastanza a lungo da permettere ai processi esecutivi di lavorarci»46 [Ramachandran 1997, 438]. Ipotizzo che debba esistere abbastanza a lungo da potersi associare con altre rappresentazioni; Grossberg [1999, 2] conferma, in altri termini, la proposta di Ramachandran: «prima che un’intera composizione di suoni, come la parola VAI, possa essere elaborata come un tutto, è necessaria una ricodifica, ad un livello successivo di elaborazione, in uno schema spaziale di attivazione disponibile simultaneamente»47. Potrei intepretare così Grossberg: perché l’attività di una popolazione di neuroni venga riconosciuta come un unicum da altre aree cerebrali occorre che sia «disponibile simultaneamente», sia cioè mantenuta costante (ripetendo i patterns di scarica) il tempo sufficiente per creare attivazione (tramite risonanza) in altre aree. Se entrambi gli aggregati sono delle combinazioni di blocchi più piccoli occorre che queste combinazioni siano «congelate» per un tempo sufficiente. Sarò sincero, non ho una soluzione sicura e facile per questo problema. Si potrebbe benissimo sostenere che la difficoltà di questo problema sia uno dei punti deboli del mio modello. Penso però che siano possibili almeno diverse spiegazioni valide, e qui di seguito ne passo in rassegna alcune; in molti casi posso solo indicare una via e mostrare cosa possa renderla attraente. Potrebbe anche darsi che siano richiesti più fenomeni per permettere quel miracolo di precisione richiesto dall’associazione tra gruppi combinati. 13 3.1 Percorsi privilegiati Visto che le rappresentazioni nuove si inseriscono su quelle vecchie, in realtà a variare saranno le combinazioni, e non ci saranno, da un certo momento dello sviluppo, forti variazioni a livello strutturale e di connessioni. I percorsi di legame tra aree multimodali hanno una forte dose di «preferenzialità», se mi è concesso il termine, quindi non occorrono particolari modifiche che portino alla creazione di nuovi legami associativi tra rappresentazioni. L’idea è che la presenza di forti relazioni gerarchiche all’interno delle aree unimodali e tra unimodali e multimodali possa favorire lo sviluppo di legami tra le componenti delle rappresentazioni; si tratta quindi di rimescolare un alfabeto non molto numeroso e, soprattutto, all’interno del quale le variazioni sono fisicamente vincolate dalle connessioni impiegate. Per capirci, potrebbe benissimo darsi che una classe di immagini sia connessa con una classe di parole semanticamente inerenti. Non sarà molto difficile imparare nuove immagini o nuove parole: gran parte dei collegamenti sono già presenti. Occorrono più che altro delle corrette relazioni da un punto di vista temporale: occorre che questo alfabeto sia precisamente ricombinato ogni volta. Ritengo che questa soluzione abbia una dose di plausibilità: i principi gerarchici sembrano poter spiegare bene fenomeni come la categorizzazione. 3.2 Ippocampo In realtà l’iniziale memoria delle due rappresentazioni si fissa nell’ippocampo, poi, con gli anni, emerge nelle associazioni tra aree nella corteccia. Ma non c’è un accordo assoluto sul ruolo dell’ippocampo, e, per di più, alcune forme di memoria non sembrano interessate dall’ippocampo quanto altre48. Il mio punto di vista è questo: l’associazione tra rappresentazioni nella corteccia deve avere luogo. Perché altrimenti non si spiegherebbe il ragionamento. E sono convinto che abbia luogo abbastanza in fretta. Quindi pensare che sia l’ippocampo ad assolvere il compito di fissare per un po’ le combinazioni non mi sembra un’utile soluzione. 3.3 Mancanza di una visione «diluita nel tempo» In realtà la combinazione tra due aggregati richiede del tempo o del rehearsal49. Non solo, deve essere ripetuta abbastanza spesso. Si spiegherebbe così il fenomeno della specializzazione, ossia il fatto che ogni persona sia più pronta e rapida nel ragionamento se ha a che fare con materie che conosce, piuttosto che con materie studiate nel passato. La soluzione starebbe nell’esercizio (e quindi irrobustimento) continuo di certe associazioni a svantaggio di altre (indebolite dalla long-term depotentiation). Ho introdotto questa considerazione pensando al fatto che non sperimentiamo ripetizioni a livello cosciente durante il nostro apprendimento e durante il recupero. Ma mi sono reso conto che allo stesso modo non sperimentiamo l’attività di integrazione di qualità diverse; questa non è quindi una grande obiezione. Probabilmente la ripetizione delle associazioni, combinata con 14 meccanismi di depotenziamento (quali quelli probabilmente presenti nel sonno) è una valida risposta ai miei problemi di come spiegare l’apprendimento. 3.4 Il sonno Potrebbe darsi che il sonno serva a riequilibrare le sinapsi50, abbassando quelle che non sono state utilizzate, oppure forzando quelle che si sono appena stabilite. Non c’è un’opinione condivisa su questi meccanismi. Penso che un simile meccanismo possa in parte spiegare l’apprendimento di associazioni, mediante il ridimensionamento di quelle che non vengono impiegate, ed essere un’illuminante modo di comprendere il motivo per cui sogniamo: riattiviamo le rappresentazioni per rinforzare i percorsi che hanno iniziato a formarsi di giorno. Ma, dato che questa riattivazione non è pilotata e precisa, in realtà si attivano anche molte rappresentazioni non direttamente implicate. 3.5 Sincronizzazione A favore della sincronizzazione come sistema di binding ci sono molti dati e molte teorie. Ma sollevo una questione: se due sistemi appartenenti a due diverse modalità si coordinano e si equilibrano vicendevolmente non si rischia di avere una eccessiva influenza reciproca, tale da compromettere la fedeltà allo stimolo? Ho trovato una possibile risposta, confortante, nelle dispense del corso di «Caos deterministico e applicazioni»: «la sincronizzazione completa preserva la caoticità del movimento dei due sistemi» [Piccardi 2006]. Ciò potrebbe significare che la sincronizzazione completa tra i due sistemi costituiti dalle due rappresentazioni preserva l’unicità dei due sistemi nella formazione della propria rappresentazione unimodale. Purtroppo la sincronizzazione completa richiede l’identità dei due sistemi, e mi sembra questa una richiesta molto forte. Non è naturalmente possibile indagare fino in fondo questa tematica, ma potrebbe essere un terreno decisamente interessante. 3.6 Attrattori «Un attrattore è un insieme verso il quale evolve un sistema dinamico dopo un tempo sufficientemente lungo» [da Wikipedia]. Il motivo per cui introduco il seguente concetto dipende dalla sua capacità di rispondere alle esigenze tipiche di una rappresentazione distribuita, dato che sa giustificarne le caratteristiche salienti: unità e discretezza (una rappresentazione è, da un punto di vista cognitivo, un’unità indivisibile e in sè completa) e, soprattutto, sa essere abbastanza flessibile da mantenere questa unità anche di fronte a sottili variazioni a livello strutturale (nel numero dei neuroni connessi, nelle differenze nei patterns di scarica). Nelle parole di Treves: «l’elemento cruciale perché questo accada è la natura discreta degli attrattori del network locale. La discretezza degli attrattori locali può fornire la capacità di correzione di errori e la robustezza al rumore che sono spesso associate con l’elaborazione di simboli discreti»51 [Treves 2005, 279]. Il sistema dinamico costituito dai neuroni che scaricano tende a 15 raggiungere il medesimo attrattore, anche se parte da condizioni di volta in volta leggermente differenti. Mi sembra molto favorevole a spiegare la costanza simbolica del mentale, il fatto che rievochiamo gli stessi simboli più volte senza variazioni evidenti. Nelle parole di Calvin questi fenomeni sono ancora più chiari: La cattura è un altro aspetto della risonanza e degli attrattori che può essere utile qui: una sequenza spaziotemporale che arriva molto vicina ad una sequenza dell’attrattore può essere modificata in conformità con quella dell’attrattore. Quando ti senti catturato da questa strada scivolosa, è perché sei stato realmente forzato in un attrattore. Questa convergenza è un altro modo di dire che gli attrattori hanno un bacino di attrazione, un ampio insieme di condizioni iniziali che portano tutte alla fine allo stesso attrattore52. Eppure il problema degli attrattori è che quelli caotici non sono un equilibrio: le rappresentazioni non sarebbero stabili, bensì varierebbero secondo la «legge» dell’attrattore. Due rappresentazioni governate da attrattori caotici si invieranno dei patterns continuamente variabili. Questo rende impossibile la formazione di associazioni stabili a livello sinaptico. Però potrebbe significare che la memorizzazione su base associativa richieda la ripetizione nel corso della vita dell’associazione. Invece di una ripetizione nel breve termine occorre una ripetizione nel lungo termine. Esprimermi ora su queste tematiche mi sembra sinceramente prematuro, ma non v’è dubbio alcuno sull’importanza che gli studi sul caos rivestono nel panorama delle neuroscienze. 4 CONCLUSIONI Ho cercato di presentare un’idea di rappresentazione che sia capace di essere fedele al lato neurobiologico ma al tempo stesso di conservare il suo carattere simbolico. Nel farlo ho dovuto affrontare due problemi, la distinzione e la memorizzazione; ho proposto che l’associazione tra rappresentazioni di diverse modalità possa essere una soluzione. Una rappresentazione fonologica già ordinata ordinerà una rappresentazione visiva in formazione. Naturalmente questo è valido anche nei compiti di recupero in memoria: per riattivare l’immagine di un ricordo attiverò prima una parola, o un insieme di parole, che possano descrivere la scena. Uno dei motivi per cui ritengo interessante la mia proposta sta nell’idea che ho che la memoria giochi un ruolo fondamentale nel pensiero; come afferma Treves [1998, 154]: «[…] molte funzioni corticali, se osservate sufficientemente in astratto, sono scomponibili in un numero ristretto di operazioni, di cui le principali sono l’individuazione o categorizzazione e l’associazione. Entrambe sono fondamentalmente operazioni di memoria». Penso che dare una spiegazione basata su rappresentazioni possa essere un buon modo per conciliare diverse prospettive e fenomeni; per avvicinare il piano neurale a quello mentale (simbolico e cosciente). Per quanto la mia proposta richieda sicuramente molti raffinamenti spero possa almeno servire da spunto per altre idee, magari più precise ed empiricamente supportate. 16 Note 1 «A representation can be any physical object or state that is somehow made to stand-in for (i.e. 're-present') some other physical object or state (or extremely complex disjunction of states or objects -- including abstract objects, such as numbers)» Dizionario online di filosofia della mente. (http://www.artsci.wustl.edu/~philos/MindDict/representation.html) 2 Una rappresentazione possiede un contenuto, un referente (l’oggetto rappresentato), delle condizioni di verità (in quali casi la rappresentazione è vera o falsa) il valore di verità (quando la rappresentazione ci parla correttamente della realtà esterna); una buona trattazione delle rappresentazioni mentali si può trovare a questo indirizzo: http://plato.stanford.edu/entries/mentalrepresentation/ 3 Il mio interesse verso le rappresentazioni è, in questo capitolo, eminentemente funzionale: le considero dei «mattoni di informazione« che le diverse aree cerebrali producono e condividono per svolgere le funzioni cognitive richieste dall’ambiente. Quindi mi occupo soprattutto delle modalità organizzative, non delle relazioni che le rappresentazioni hanno con il mondo esterno. 4 Risulta evidente la scelta di legare dato psicologico e biologico; mi allontano da un approccio psicologistico o estremamente filosofico. 5 Occorre una comprensione intuitiva del termine in questo contesto: pensiamo alla nostra esperienza. 6 A titolo meramente speculativo ritengo però interessante riflettere sui neuroni specchio: gli studi del gruppo di Parma hanno evidenziato come i gruppi di neuroni nelle cortecce pre-motorie codifichino atti (come «afferrare per mangiare», «prendere con precisione»); gli atti sembrano essere abbastanza complessi e, soprattutto, sembrano inserirsi perfettamente nella logica con cui ragioniamo coscientemente: per questo potrebbero nascere da collegamenti con rappresentazioni e comportarsi come rappresentazioni. 7 Cfr. Edelman, Tononi [2000, 136-7]. 8 Cfr. Un ultimo sforzo: equilibri e dinamiche, pag. 13. 9 Penso che alcune riflessioni interessanti in proposito possano essere trovate nei lavori di Francis Crick e Christof Koch: cfr. Metzinger [2000, 104-6]; rimando poi all’ultimo lavoro di Koch [2004]. 10 Da filosofo so quanto il concetto di indiscutibilità sia privo di senso; il mio ragionamento è dettato da esigenze divulgative e pragmatiche; in pratica non intendo far finta che i qualia non esistano, visto che li citerò spesso, ma neppure posso fare uno studio unicamente sulla coscienza. 11 Ma ci sono interessanti tentativi: cfr. Holoyak, Hummel [2003]; Cleeremans [1993]. 12 Cfr. ancora Edelman, Tononi [2000, 136-7]. 13 Non vorrei risultare pedante, ma occorre capire che serve un’organizzazione precisa perché possano nascere scritte diverse con lo stesso materiale a disposizione. 14 «In assembly coding, two important constraints need to be met. First, a selection mechanism is required that permits the dynamic yet consistent association of neurons into distinct, functionally coherent assemblies. Second, responses of neurons that have been identified as groupable must be labelled so that they can be recognized by subsequent processing stages as belonging together». 15 Difficile sapere come identificare questi sottogruppi e di cosa siano costituiti; sono qualità base (qualia)? Sono simboli? Per ora cito questa frase: «Il concetto di semiconnettività comporta, al livello dei circuiti locali, che neuroni adiacenti abbiano le stesse proprietà di risposta (ad esempio l’orientamento delle colonne nella corteccia visiva primaria) laddove neuroni leggermente distanti possono avere caratteristiche di risposta sovrapponibili, ma non identiche». [McIntosh 2000, 862] Penso quindi che neuroni adiacenti codifichino la stessa qualità e che un raggruppamento dia vita a diverse rappresentazioni a seconda di come e con chi si combini. 16 «Sequenze» è forse il termine migliore in questo contesto. 17 «According to this class of theories, visual long-term memories of shapes are stored in an abstract code in the inferior temporal lobes. At least in the monkey brain, such memories are stored using a population code; activation in sets of columns—not patterns of activation in topographically organized areas—specifies shape. […] the local geometry of shapes is only implicit in the longterm memory (LTM) representation, and is made explicit by generating patterns of activation in topographically organized early visual cortex». 18 La mia è una metafora: occorre evitare di pensare ad una qualche intenzionalità dei neuroni. 17 Un dettaglio tecnico: simbol tokens significa proprio avere a che fare con corrispettivi fisici, organizzazioni di aggregati neurali; la rappresentazione codificata raccoglie la complessa struttura composizionale. 20 «Van Gelder (1990) has expressed this distinction by noting that the connectionist implementations of compositional structure have used “functional compositionality”, rather than the “concatenative compositionality” that has been used in more traditional AI approaches. Functional compositionality is achieved by the use of (possibly quite complex) functions which operate on symbol tokens, and produce a coded representation of a complex compositional structure. These models differ from the symbolic models in that the compositional representation need not contain explicit physical tokens of the original constituents, but may instead only contain the original information in a very implicit way». 21 Cercherò di presentare una modalità di apprendimento che deriva dall’associazione tra modalità diverse (p. es. associo un’immagine al suo nome); non mi occupo dell’apprendimento unimodale (p. es. associare una nuova parola al lessico preesistente). Ma non penso che nel caso dell’apprendimento unimodale il meccanismo sia troppo diverso: «Abbiamo sviluppato un modello del loop fonologico [meccanismo di ripetizione] che ottiene il binding utilizzando diversi substrati neurali a seconda delle diverse posizioni, in sequenza, dei fonemi» [O’Reilly 2001, 3]. 22 «Everyday experiences unfold in multiple modalities. The establishment of a durable record of experience, and its associative incorporation into the existing base of knowledge, necessitate multimodal integration». 23 «Transmodal areas are not necessarily centres where convergent knowledge resides, but critical gateways (or hubs, sluices, nexuses) for accessing the relevant distributed information». 24 Ad esempio le moltiplicazioni richiedono l’uso di rappresentazioni fonologiche, essendo basate sull’apprendimento e la combinazione delle «tabelline«; cfr. Dehaene [2003]. 25 «The subject first has to translate the visual letter representations into their corresponding phonological representations (the names of the letters)». 26 «This raises the possibility that the parietal area of interest may be activated in our neuroimaging studies because it is part of the circuitry involved in translating the visually presented verbal materials into a phonological code, and then the area simply remains active for a few seconds, where this persistence of activity constitutes the pure storage function of verbal WM». 27 «[…] inferotemporal activations, due to object recognition, were profoundly modulated by phonological retrieval of the object’s name». 28 Una breve pausa per capire il significato di «risuona«; alcuni corpi rigidi che possono vibrare hanno delle frequenze di vibrazione precise e costanti: se, ad esempio, prendiamo due diapason di frequenza uguale, li avviciniamo e ne mettiamo uno in vibrazione otterremo, dopo un breve intervallo, vibrazioni della stessa frequenza anche nell’altro diapason; l’idea di Izhikevich è simile: i gruppi rispondono a degli input che corrispondono alla frequenza propria che fa risuonare il diapason. 29 «Learning of a new input consists of selecting and reinforcing an appropriate group (or groups) that resonates with the input». 30 «Assigning the representation (meaning) to the group consists of potentiating weak connections that link this group with other groups coactive at the same time, that is, putting the group in the context of the other groups that already have representations». Fuster [2002, 14] conferma, in altri termini, l’idea di Izhikevich: «l’esperienza in atto viene incorporata, attraverso lo sviluppo di nuove connessioni, in una rete prestabilita. Ogni nuova esperienza si installa su un substrato di memoria più antica, evocata per somiglianza. La convergenza sincronica è, in ogni caso, il principio chiave perché si formi la nuova rete mediante la coincidenza temporale dell’informazione nuova con quelle della rete antica riattivata». 31 Ricordando che i costituenti sono qualia o simili (cfr. nota pag. 7), il significato immediato di una rappresentazione potrebbe essere nella sua stessa presentazione, nel modo in cui viene esperita dal soggetto; naturalmente occorre anche tenere in considerazione molti altri fattori che non posso ora analizzare, mi limito a citare contesto e legame con il mondo esterno. 32 TEO and V4 were thus characterized by the mixture of cells with various levels of selectivity. We may take this mixture of various cells as evidence that selectivity is constructed through local networks in these regions. If we randomly sample cells from a local network in which the selective responses to complex features are constructed by integrating simple features, the sample should include cells with various levels of selectivity. Cells located close to the input end should be maximally activated by simple features, cells close to the output should respond only to the complex features, and cells at intermediate stages should show some intermediate properties. The areas that satisfy this condition were TEO and V4. 19 18 33 «Every time the input is presented to the network, a polychronous group (or groups) whose spike-timing pattern resonates with the input is activated (i.e., the neurons constituting the group polychronize)». 34 Aree di Broadmann 17 e 18, aree di elaborazione visiva primaria. 35 Conservante le relazioni spaziali presenti nell’oggetto. 36 Almeno due modelli influenti descrivono il riconoscimento secondo una logica combinatoria: cfr. Treisman e Gelade [1980], Biederman [1987]. 37 Spiegherò con dettagli tecnici questo discorso; per ora accontentiamoci di una comprensione intuitiva: per associare due puzzle devo averli finiti, non ha senso associarli con tessere mancanti! 38 Cfr. D’Angelo et al. [2002, 24]; cfr. Conti [2005, 190]; detto molto semplicemente: il rafforzamento a lungo termine richiede frequenze elevate nelle scariche tra neuroni; perché si abbiano frequenze elevate è sensato pensare ad una ripetizione dello stesso treno di scariche più volte. 39 Sebbene mi sia occupato soprattutto di Izhikevich il concetto di risonanza appare essere diffuso nella comunità neuroscientifica: rimando a Lamme [2004], Pollen [2003], Dehaene et al. [2006]. In questi lavori l’attivazione risonante sembra essere una condizione dell’esperienza cosciente. 40 Coscienza auto-organizzante. 41 «Mental life is posited as co-extensive with consciousness» [Perruchet, Vinter, 2002, 299]. 42 «The word representation designates a mental event that assumes the function of some meaningful component of the represented world (e.g. a person, an object, a movement, a scene) within the representing world». (ibidem) 43 «Our approach consists in showing that a large number of phenomena that seemingly require unconscious rule of abstraction processes, inferences, analyses, and other complex implicit operations, can be accounted by the formation of conscious representations that are isomorphic to the world structure». 301. 44 «The key point is that each conscious experience triggers associative learning mechanisms that take the components of this experience [l’esperienza conscia] as the ‘stuff’ on which they operate«. 302. 45 «The representation of external events […] may be quite complex. […] they may be representations of combinations or configurations of […] elementary stimuli» (p. 303). 46 «In order to make decisions on the basis of a qualia-laden representation, the representation needs to exist long enough for executive processes to work with it». 47 «Before an entire pattern of sounds, such as the word GO, can be processed as a whole, it needs to be recoded, at a later processing stage, into a simultaneously available spatial pattern of activation». 48 Cfr. Treves 1998. 49 Ripetizione, a voce alta o «a mente» di una parola, una frase, un insieme di numeri, al fine di favorirne la memorizzazione. 50 Cfr. Huber, 2004. 51 «The crucial element for this to occur is the discrete nature of local network attractors. The discreteness of local attractors can provide the error correction capability and the robustness to noise that are often associated with the processing of discrete symbols». 52 «Capture is another aspect of resonance/attractors that will be useful here: a spatiotemporal pattern that comes close to an attractor’s pattern will be altered to conform with that of the attractor. When you feel captured by that washboarded road, it’s because you really are being shoehorned into an attractor. This convergence is another way of saying that attractors have a basin of attraction, a wide set of starting conditions that all eventually lead into the same attractor cycle» [http://williamcalvin.com/bk9/bk9ch5.htm]. 19 BIBLIOGRAFIA Baddeley, A. 1996 Biederman, I. 1987 Chalmers, D.J. 1990 Cleeremans, A. 1993 The fractionation of working memory, in «Proc. Natl. Acad. Sci. USA», vol. 93, n. 24, pp. 13468-13472. Recognition-by-components: A theory of human image understanding, in «Psychological Review», vol. 94, n. 2, pp. 115-147. Syntactic Transformations on Distributed Representations, in «Connection Science», vol. 2, pp. 53-62. Mechanism of Implicit Learning, Cambridge MA, The MIT Press. Conti, F., (a cura di) 2005 Fisiologia Medica (I volume), Milano, Edi-ermes. D’Angelo, E., Rossi, P., Taglietti, V. 2002 Dalle sinapsi alla memoria, in «Le Scienze Dossier», n. 14, pp. 20-25. Dehaene, S., Piazza, M., Pinel P. and Cohen, L. 2003 Three parietal circuits for number processing, «Cognitive Neuropsychology», n. 20, pp. 487-506. in Dehaene, S., Changeux, J.-P., Naccache, L., Sackur, J, and Sargent, C. 2006 Conscious, preconscious, and subliminal processing: a testable taxonomy, in «Trends in Cognitive Sciences», vol. 10, n. 5, pp. 204-211. Edelman, G.M., Tononi, G. 2000 A universe of consciousness. How matter becomes imagination, Basic Book, New York, (tr. it. a cura di Ferraresi, S., Un universo di coscienza. Come la materia diventa immaginazione, Torino, Einaudi, 2000). Fuster, J.M. 2002 La localizzazione della memoria, in «Le Scienze Dossier», n. 14, pp. 12-19. Friston, K.J., Price, C.J., Fletcher, P., Moore, C., Franckoviak R.S.J. and Dolan, R.J. 1996 The trouble with cognitive subtraction, in «Neuroimage», Vol. 4, n. 2, pp. 97-104. 20 Grossberg, S. 1999 The link between brain learning, attention and consciousness, in «Consciousness and Cognition», n. 8, pp. 1-44. Houdé, O., Kayser, D., Koenig, O., Proust J., Rastier, F. 1998 Vocabulaire de sciences cognitives, Paris, Presses Universitaires de France, (tr. it. a cura di Quintili, P., Dizionario di scienze cognitive, Roma, 2000). Huber, R., Ghilardi F.M., Massimini M. and Tononi G. 2004 «Local sleep and learning», Nature, n. 430, pp. 78-81. Hummel J.E., Holyoak J.K. 2003 A Symbolic-Connectionist Theory of Relational Inference and Generalization, in «Psychological Review», vol. 110, n. 2, pp. 220-264. Izhikevich, E. 2006 Koch, C. 2004 Polychronization: Computation with spikes, in «Neural Computation», n. 18, pp. 245-282. The Quest for Consciousness: A Neurobiological Approach, Roberts & Company Publishers. Kosslyn S.M., Thompson W.L. 2003 When Is Early Visual Cortex Activated During Visual Mental Imagery?, in «Psychological Bulletin Copyright», vol. 129, n. 5, pp. 723-746. Lamme, V.A.F. 2004 McIntosh A.R. 2000 Mesulam, M.M. 1998 Metzinger, T. 2000 Separate neural definition of visual consciousness and visual attention; a case for phenomenal awareness, in «Neural Networks», vol. 17, n. 5-6, pp. 861-872. Towards a network theory of cognition, in «Neural Networks», vol. 13, n. 8-9, pp. 861-870. From sensation to vol. 121, pp. 1013-1052. cognition, in «Brain», Neural Correlates of Consciousness: Empirical and Conceptual Questions, Cambridge MA, The MIT Press. Nyberg, L., McIntosh, A.R., Cabeza, R., Habib, R., Houles, S., Tulving, E. 21 1996 General and specific brain regions involved in encoding and retrieval of events: What, where, and when, in «Proc. Natl. Acad. Sci. USA», vol. 93, no20, pp. 11280-11285. Perruchet, P., Vinter, A. 2002 The self-organizing consciousness, in «Behavioral and Brain Sciences», n. 25, pp. 297-330. Piccardi, C. 2006 Sincronizzazione in dispense per il corso di «Caos deterministico e Applicazioni», Politecnico di Milano. Ramachandran, V.S., Hirstein, W. 1997 Three Laws of Qualia, in «Journal of Consciousness Studies», vol. 4, n. 5-6, pp. 429-458. O’Reilly, R.C., Busby, R.S., Soto, R. 2001 Three Forms of Binding and their Neural Substrates: Alternatives to Temporal Synchrony, (Capitolo sottoposto a: Cleeremans, A. (a cura di), The Unity of Consciousness: Binding, Integration, and Dissociation, Oxford, Oxford University Press, 2003). Singer, W. 1998 Consciousness and the structure of neuronal Representations, in «Phil.Trans. R. Soc. Lond. B», n. 353, pp. 1829-1840. Smith, E., Jonides, J. 1998 Neuroimaging analyses of human working memory, in «Proc. Natl. Acad. Sci. USA», vol. 95, pp. 12061-12068. Treisman, A.M., Gelade, G. 1980 A feature-integration theory of attention, in «Cognitive Psychology», n. 12, pp. 97-136. Treves, A. 2005 Treves, A. 1998 Turing, A.M. 1950 Frontal latching networks: a possible neural basis for infinite recursion, in «Cognitive Neuropsychology», vol. 22, pp. 276-291. Come funziona la memoria, Milano, Bruno Mondadori. Computing machinery and intelligence, in «Mind», n. 59, pp. 433-460. Vallar, G. 22 2006 Memory systems: The case of phonological short-term memory. A festschrift for Cognitive Neuropsychology, in «Cognitive Neuropsychology», vol. 23, n. 1, pp. 135-155. 23