Paradigmi di Controllo Motorio
Transcript
Paradigmi di Controllo Motorio
Paradigmi di Controllo Motorio Pietro G. Morasso e Vittorio Sanguineti Dipartimento di Informatica, Sistemistica, Telematica (DIST) Università di Genova Via Opera Pia 13, I-16145 Genova, ITALIA E-mail: [email protected], [email protected] In “Bioingegneria della postura e del movimento” (A. Cappello, A. Cappozzo e P. di Prampero editori), Patron Editore, Bologna, 2003, pp. 307-338. 1. Introduzione Comprendere le modalità secondo cui gli esseri umani coordinano i movimenti, sia quelli apparentemente semplici della vita quotidiana sia quelli ‘estremi’, in campo sportivo o artistico, è un importante obiettivo scientifico con rilevanti implicazioni mediche, psicologiche, cinesiologiche, cibernetiche. Per ‘controllo motorio’ intendiamo la capacità del sistema nervoso di regolare o dirigere il movimento. Quest’ultimo è spesso descritto nel contesto dell’esecuzione di una particolare azione; quando si studia il controllo motorio, lo si fa in relazione ad azioni specifiche: cammino, corsa, raggiungimento (reaching), fonazione, controllo della stazione eretta. In pratica si studia come viene controllato il movimento nel contesto di una specifica attività, assumendo che ciò fornisca informazioni sui principi generali. Il movimento, poi, non può essere studiato senza tenere conto della percezione. Per ‘percezione’ si intende l’integrazione dei dati grezzi sensoriali in informazioni fruibili cognitivamente. E’ importante sottolineare che percezione e azione sono essenziali l’una all’altra: la percezione, cioè, non è un meccanismo passivo, ma attivo, che mira ad anticipare le conseguenze sensoriali di un’azione, legando quindi le informazioni sensoriali e i comandi motori in un ‘tessuto computazionale’ coerente. I sistemi sensoriali/percettivi forniscono informazioni sullo stato del corpo (ad esempio, la posizione del corpo nello spazio) e sulle caratteristiche dell’ambiente, critiche per la regolazione del movimento (ad esempio, la presenza di ostacoli). Un ultimo aspetto, non meno importante dei precedenti, è il legame del movimento con processi cognitivi quali l’attenzione, la motivazione, le emozioni; sono questi ultimi a determinare la formazione dell’intento o obiettivo del movimento. In questo capitolo verranno affrontate alcune questioni fondamentali per la comprensione del controllo neurale dei movimenti: (i) Come fa il sistema nervoso a organizzare i singoli muscoli e articolazioni in movimenti coordinati? (il cosiddetto problema dei gradi di libertà, Bernstein 1967); (ii) Come viene utilizzata l’informazione sensoriale relativa all’ambiente esterno e allo stato del corpo stesso per selezionare e controllare il movimento? Ossia, che ruolo ha la percezione nel controllo dei movimenti? 1.1. Teorie del controllo motorio L’evoluzione delle conoscenze sulla struttura e sull’organizzazione del sistema nervoso ha via via ispirato nuove ‘teorie’ del controllo motorio, intese come schemi concettuali in grado di fornire una immagine coerente delle osservazioni sperimentali. Ne presentiamo un elenco sintetico, in ordine approssimativamente cronologico. • Teorie basate sui riflessi.. Si richiamano alla nozione di arco riflesso, tradizionalmente attribuita a Cartesio (Descartes 1662) e si basano sull’ipotesi di Sherrington (1906) che i riflessi abbiano una funzione integrativa, ossia che rappresentino gli elementi costitutivi dei comportamenti complessi. In altre parole, un comportamento motorio complesso sarebbe interpretabile come una concatenazione di riflessi elementari. • Teorie gerarchiche. Ispirate alle teorie evoluzionistiche, si basano sull’osservazione di John Hughlings Jackson (1873) che il sistema nervoso è organizzato come una gerarchia, comprendente livelli superiori, intermedi e inferiori di controllo (rispettivamente, le aree corticali associative, la corteccia motoria ed il midollo spinale). Nella sua evoluzione, il controllo nervoso passerebbe da uno stato più semplice, in cui prevalgono i centri inferiori altamente organizzati, ad uno stato più complesso, in cui prendono il sopravvento i centri superiori paradossalmente meno organizzati perché più flessibili, e quindi il controllo si trasforma da ‘automatico’ a ‘volontario’. Le patologie sarebbero interpretabili come una ‘dissoluzione’ ossia come una inversione dell’evoluzione. Un’ulteriore evoluzione delle teorie gerarchiche e di quelle basate sui riflessi è la cosiddetta teoria riflesso/gerarchica secondo cui i movimenti sarebbero interpretabili come gerarchie di riflessi. • Teorie dei programmi motori. Traggono origine dalla scoperta (Wilson 1961, Grillner 1981) che i movimenti ciclici (la locomozione, ad esempio) sono controllati da generatori di ‘ritmi’ (central pattern generator, CPG) che dipendono debolmente dal controllo centrale o da stimoli sensoriali. Ciò ha spostato l’enfasi dai comportamenti reattivi ai comportamenti ‘attivi’, non necessariamente originati da stimoli sensoriali. La nozione di generatore di ritmi si è in seguito evoluta in quella, più astratta e generale, di ‘programma motorio’ (Keele 1968). Per programma motorio si intende una ‘rappresentazione mentale’ astratta di una certa azione, invariante rispetto agli aspetti geometrici e dinamici relativi alla sua traduzione in movimento. A parziale supporto di questo punto di vista, è stato ad esempio rilevato come alcune caratteristiche individuali della scrittura corsiva siano invarianti rispetto alla scala (nella scrittura su un foglio di carta o su una lavagna, per esempio), al tipo di utensile (penna, gesso o altro) e al tipo di effettore (mano, piede, testa) (Rosenbaum 1991). • Teorie cibernetiche. Potrebbero essere sintetizzate con lo slogan ‘dalla fisiologia delle azioni alla fisiologia dell’attività’ (Bernstein 1967) e sono ispirate alla nascita della teoria dei controlli (cibernetica). Gli elementi fondamentali si possono enunciare sotto forma di una serie di affermazioni: (i) E’ impossibile capire il movimento senza studiare la meccanica e le proprietà degli ‘attuatori’; (ii) Il problema fondamentale nella fisiologia delle azioni è quello di dominare l’estrema ridondanza dei gradi di libertà intrinseci, riducendone il numero effettivo in base alle esigenze funzionali di ogni specifica attività, ossia costruendo una ‘sinergia funzionale’. • Teorie dinamiche. Sono ispirate ai concetti ed alla terminologia della dinamica non-lineare e si basano sull’idea che il sistema motorio è costituito di un insieme di moduli interagenti. Secondo queste teorie, le proprietà fondamentali del sistema motorio sarebbero l’autoorganizzazione, intesa come proprietà emergente della dinamica interattiva e non come risultato di un controllo gerarchico; la non-linearità, che permette di ottenere ‘transizioni di regime’ (per esempio in movimenti ritmici) semplicemente modulando dei parametri di controllo rispetto a dei valori ‘critici’; la presenza di attrattori (la cui maggiore o minore stabilità è alla base della variabilità osservata nei comportamenti motori). • Teorie ecologiche. Enfatizzano l’importanza dell’ambiente (oltre alla finalizzazione dell’azione) nella strutturazione di coerenti processi percettivi e motori (Gibson 1966). Esempi tipici sono atterrare (dopo una fase di volo), afferrare o colpire al volo, in cui la tempistica di percezione e movimento è ovviamente critica. L’idea è che l’ambiente stesso, nel contesto di un’azione, fornisce ‘gratis’ delle informazioni specifiche (affordances) che il processo sensorimotorio deve solo imparare a ‘cogliere’, semplificando enormemente il normale ciclo percezione-movimento. Negli esempi citati l’informazione critica è il tempo all’impatto, che può essere stimato riducendo il processo percettivo ad una stima del tasso di variazione del flusso ottico e che permette l’asservimento dei movimenti finalizzati allo scopo (atterrare, colpire, ecc.). Lo sviluppo della robotica e della teoria dei controlli ha fatto sì che ci si ponessero delle domande relativamente alla natura ed alla strutturazione dei processi di ‘calcolo’ che debbano essere effettuati per controllare un ‘corpo’, sia esso biologico o artificiale. Sono state quindi sviluppate teorie del controllo motorio che mirano ad una formalizzazione in termini di computazionali processi interagenti. Queste teorie si potrebbero definire ‘computazionali’ e verranno passate in rassegna in questo capitolo, mettendo l’accento sul problema di come controllare la dinamica del corpo e prendendo in considerazione due aspetti particolari: il ruolo delle proprietà degli attuatori e quello dei modelli o rappresentazioni ‘interne’. 1.2 Natura ecologica del controllo motorio Si è già detto dell’intimo legame fra percezione e azione. Già gli studi pionieristici di Helmholtz e von Uexküll avevano suggerito che il cervello utilizzi i comandi motori anche per interpretare le conseguenze sensoriali del movimento. Questa nozione è tornata in auge nel recente filone di ricerca orientato alle modalità di apprendimento dei modelli di controllo. Un termine comunemente utilizzato è quello di corollary discharge (von Holst e Mittelstaedt 1950). In particolare, ciò implica un paragone effettuato internamente tra un segnale in uscita (la cosiddetta copia di efferenza) e la corrispondente ri-afferenza sensoriale: la coerenza tra le due rappresentazioni è la base per la stabilità del mondo senso-motorio. Questo tipo di circolarità e complementarietà tra comandi motori e segnali sensoriali è ovviamente incompatibile con un gran numero di schemi interpretativi basati su un’organizzazione gerarchica dell’informazione e del controllo. Un tipo simile di circolarità è peraltro implicitamente presente nel concetto Piagetiano di reazione circolare, con cui viene caratterizzato il processo di apprendimento senso-motorio negli esseri umani (Piaget 1963). Si può inoltre identificare un ulteriore fenomeno di circolarità nell’interazione organismo/ambiente all’interfaccia meccanica tra il corpo ed il mondo esterno, in cui le proprietà meccaniche dei muscoli interagiscono con le proprietà fisiche degli oggetti inanimati. Questo filone di ricerca si è andato sviluppando dalla scuola Russa, con il lavoro pionieristico di I.P. Pavlov sulla natura dei riflessi e la successiva rilettura critica effettuata da P.K. Anhokin (1974) e N. Bernstein (1967). In particolare, si deve a Bernstein il modello del comparatore, secondo cui i comandi motori sono da soli insufficienti a determinare il movimento ma identificano soltanto un fattore in un’equazione complessa dove la dinamica dell’ambiente gioca un ruolo determinante. Questo ha portato, tra le altre cose, a sottolineare la rilevanza della stiffness muscolare e la formulazione della teoria del punto di equilibrio (Feldman 1966, Feldman & Levin, 1995, Bizzi e coll. 1992), discussa nelle sezioni successive. In generale, si può dire che la corollary discharge di Helmholtz, la reazione circolare di Piaget ed il modello del comparatore di Bernstein sono modi diversi ma complementari di esprimere la natura ecologica del movimento, ovvero il rapporto di partnership tra i processi nervosi ed i processi dinamici dell’ambiente. Infine, non si può ignorare che a questo concetto di ecologia computazionale si possa ricondurre lo studio recente delle interfacce neurali bi-direzionali (Chiel 1997, DeMarse e coll. 2001, Reger e coll. 2000), con l’aggiunta di un concetto di ergonomia computazionale: con ciò ci si riferisce al fatto che le proprietà adattative del cervello non possono essere studiate isolatamente ma solo nel contesto di un’intima interazione con un corpo (naturale o artificiale) ed il mondo esterno. 1.3 Il contributo della robotica Nel campo della robotica, i processi computazionali necessari per realizzare un piano motorio sono stati oggetto di estese ricerche. Come indicato in figura 1, si possono identificare cinque blocchi principali che corrispondono a diversi processi e che, in linea di principio, potrebbero essere risolti indipendentemente e in sequenza per poter pilotare il sesto blocco (il carico): (i) formulazione del piano motorio; (ii) formazione della traiettoria; (iii) risoluzione del problema cinematico inverso; (iv) risoluzione del problema dinamico inverso; (v) attivazione degli attuatori. ---------------------Figura 1 ---------------------La formulazione del piano motorio consiste nella caratterizzazione dettagliata di un gesto intenzionale mediante la selezione dei punti iniziale e finale, degli eventuali ostacoli, l’ampiezza e l’orientazione del gesto complessivo, la durata etc, indipendentemente dalla scelta di uno specifico effettore terminale (end-effector). Dal piano motorio scaturisce una traiettoria x=x(t) dell’effettore terminale selezionato (processo di formazione della traiettoria), che viene quindi tradotta nella corrispondente traiettoria q=q(t) nello spazio delle configurazioni del corpo (problema cinematico inverso). Il passo finale è la determinazione delle forze (o coppie) che i vari attuatori devono generare per ottenere la traiettoria desiderata (problema dinamico inverso). 2. Formulazione del piano motorio 2.1 Invarianze spazio-temporali nei movimenti volontari Lo studio sperimentale dei movimenti nell’uomo e nei primati ha mostrato che i movimenti volontari obbediscono a due leggi psico-fisiche: 1. Legge di Hick-Hyman: in un task basato su scelte multiple, il tempo di reazione dipende dal logaritmo del numero di scelte (Hyman 1953). 2. Legge di Fitts: la durata di un movimento dipende dal logaritmo dell’accuratezza relativa ossia dal rapporto fra ampiezza del movimento e dimensione del target (Fitts 1954). ---------------------Figura 2 ---------------------Inoltre, l’analisi dei movimenti ha messo in evidenza degli invarianti spazio-temporali o cinematici: le traiettorie della mano verso un target sono approssimativamente rettilinee, indipendentemente da direzione e ampiezza del movimento stesso, e hanno un profilo di velocità ‘a campana’ (Morasso 1981; figura 2). Le traiettorie più complesse, come la scrittura corsiva, sono inoltre relativamente invarianti rispetto all’effettore terminale. Queste osservazioni sono state interpretate come evidenza dell’esistenza nel sistema nervoso di rappresentazioni interne a carattere puramente geometrico-spaziale. Ciò è consistente con la nozione di ‘programma motorio’ (Keele 1968) ed ha trovato supporto neurofisiologico con l’osservazione (Georgopoulos e coll. 1986) che nei primati la corteccia motoria primaria codifica la direzione istantanea del movimento. Si è poi trovato che tale correlazione si verifica anche in altre aree corticali (premotoria, motoria supplementare e parietale) ed inoltre è stato dimostrato che il codice direzionale (estratto in tempo reale mediante un array impiantato di microelettrodi) permette ad un primate di effettuare un controllo efficace dei movimenti di un robot (Wessberg e coll. 2000). Si è cercato di dare una spiegazione computazionale degli invarianti cinematica. Per esempio, è stato proposto che l’andamento ‘a campana’ del profilo di velocità sia spiegabile con l’ipotesi che uno degli obiettivi del sistema nervoso sia la massimizzazione della ‘dolcezza’ (smoothness) del movimento, un requisito ottenibile minimizzando l’integrale nel tempo della norma della terza derivata della traiettoria – il cosiddetto modello minimum-jerk (Flash e Hogan 1985). Alternativamente, è stato suggerito che le caratteristiche delle traiettorie siano conseguenze della meccanica del corpo, senza che sia necessario ipotizzare alcuna ottimizzazione (Gribble e Ostry 1996), oppure che l’ottimizzazione sia ‘globale’, cioè tenga conto della meccanica del corpo e della dinamica muscolare; ad esempio, è stato proposto che venga minimizzata la variazione del comando motorio – il modello minimum torque-change (Uno e coll. 1989), oppure l’incertezza sulla posizione finale, nell’ipotesi che nei comandi motori la varianza del rumore sia proporzionale al valore medio (Harris e Wolpert 1998). 2.2 Traiettorie complesse come composizione di traiettorie elementari Un’altra questione fondamentale è se traiettorie complesse possano essere interpretate come combinazioni di traiettorie elementari. L’osservazione della struttura temporale della scrittura corsiva (Morasso e Mussa Ivaldi 1982), quella di movimenti liberi e pseudo-casuali dell’arto superiore nello spazio tri-dimensionale (Morasso 1983) come pure quella di apertura e chiusura della laringe in sequenze di fonemi a velocità differenti hanno suggerito che in effetti un piano motorio complesso venga trattato dal sistema nervoso come una sequenza di movimenti elementari o ‘stroke’ si(t) , identificati da opportuni target intermedi o via-point e raccordati tra loro mediante sovrapposizione temporale: x(t ) = ∑ si (t − t i ) i (1) 3. Problema cinematico inverso Per movimenti nello spazio tri-dimensionale, x(t ) è (in generale) un vettore 6-dimensionale (tre dimensioni specificano la posizione, le altre tre l’orientazione dell’effettore terminale) e in accordo con la nozione di programma motorio è indipendente dallo specifico effettore terminale. Il passo successivo è la selezione dell’effettore, a cui corrisponde una specifica relazione geometrica, x=x(q), detta trasformazione cinematica diretta; q è la configurazione del corpo che, se questo è approssimabile come un insieme di corpi rigidi articolati, è definita da un insieme di angoli ai giunti. Il passo successivo è tradurre la traiettoria x(t) dell’effettore terminale nella corrispondente traiettoria q(t) nello spazio delle configurazioni. Ciò corrisponde a invertire la trasformazione cinematica diretta, per cui l’operazione è detta problema cinematico inverso. Il problema si può formulare in termini differenziali, ossia considerando movimenti di ampiezza infinitesimale. Sia J (q ) la matrice Jacobiana della trasformazione x = x(q) ; si può scrivere la relazione seguente: x& = J (q) q& (2) Se x e q hanno la stessa dimensione ed inoltre la configurazione q non è singolare, allora il problema cinematico inverso ha una sola soluzione calcolabile semplicemente come segue: q& = J (q ) −1 x& . Se invece la dimensione n di x ha è maggiore della dimensione p di q, allora la trasformazione è detta ridondante ed il problema dell’inversione cinematica ha un numero infinito di soluzioni. Dalla robotica si sa che la soluzione a minima norma, ossia quella che minimizza la norma del vettore velocità angolare, utilizza la matrice pseudo-inversa di Moore-Penrose: q& = J (q )T [ J (q ) J (q )T ]−1 x& (3) Tuttavia si tratta di una soluzione numericamente poco robusta in vicinanza delle singolarità cinematiche ed inoltre è caratterizzata da una condizione di non integrabilità, nel senso che se si pilota il robot con questo algoritmo in relazione ad una traiettoria chiusa nello spazio ripetuta più volte (come nella rotazione di una chiave inglese), si ottiene una traiettoria nello spazio dei giunti che non è chiusa e tende a spostarsi progressivamente verso le escursioni angolari limite. Non è chiaro come il sistema nervoso risolva il problema cinematico inverso. La questione è stata affrontata da molti ricercatori e sono stati proposti diversi ‘criteri di ottimalità’ biologici. Un’alternativa computazionale ‘ecologica’ è il ‘paradigma del moto passivo’ (Mussa Ivaldi e coll. 1988). Il punto di partenza è una conseguenza della geometria delle catene cinematiche, ovvero il fatto che la coppia articolare necessaria per equilibrare una forza esterna, applicata all’effettore terminale (vedi Figura 3) è data da: τ = J (q) T Fext (4) Questa relazione può essere considerata una ‘affordance’ in senso Gibsoniano e se ne può dedurre un meccanismo computazionale in cui un modello interno del braccio viene assoggettato a forze virtuali generate dal meccanismo di generazione di traiettorie precedentemente considerato. Il rilassamento del modello a tali stimoli interni (in questo senso si parla di ‘paradigma di moto passivo’) fornisce una soluzione al problema inverso senza dover invertire alcunché. Inoltre il procedimento tollera la ridondanza, sfugge alle singolarità cinematiche e soddisfa ai requisiti di integrabilità. ---------------------Figura 3 ---------------------- 4. Controllo della dinamica 4.1 Coppie di interazione dinamica Le equazioni del moto di una catena cinematica hanno la seguente struttura: I (q) ⋅ q&& + C (q, q& )q& + G (q) + J (q) T Fext = τ (5) && identifica le forze inerziali, dove q= q (t ) è la traiettoria nello spazio dei giunti, I (q )q proporzionali all’accelerazione, C (q, q& )q& le forze centripete e di Coriolis, che dipendono in modo quadratico dalla velocità, G (q ) le forze gravitazionali, che dipendono soltanto dalla configurazione, e Fext i disturbi/carichi esterni applicati all’effettore terminale. Questa equazione è fortemente non lineare ed agisce in effetti come una sorta di disturbo interno che tende a ‘perturbare’ le traiettorie pianificate. Il termine inerziale è predominante durante le parti iniziale e terminale dei movimenti, mentre il termine di Coriolis ha più peso nella parte intermedia, quando la velocità è massima. La Figura 4 mostra una simulazione relativa ad un braccio planare con 2 gradi di libertà: sono state generate 8 diverse traiettorie con lo stesso punto di partenza; per ognuna di queste è stata applicata l’Eq. 5 e la coppia generata dagli attuatori è stata tradotta in una forza equivalente, applicata all’effettore terminale, mediante l’Eq. 4. ---------------------Figura 4 ------------------------- La Figura 4 mostra che i pattern di forza (e quindi di coppia) sono assai variabili in relazione alla direzione del movimento. In particolare, se si decompone la forza in una componente longitudinale (orientata cioè come il movimento desiderato) ed una componente trasversale, la prima componente si può interpretare come la comune resistenza inerziale, che viene incontrata per esempio nella manipolazione di un grave, mentre la componente trasversale si può interpretare come un disturbo che, se non è adeguatamente compensato, tende a deviare lateralmente la traiettoria pianificata. Come si può vedere dalla figura, anche nel caso semplice di un braccio planare l’ordine di grandezza di tali forze di disturbo è paragonabile a quello delle componenti inerziali principali. Inoltre, si può anche notare che le parti iniziale e finale del movimento tendono ad essere più affette da tale disturbo di quelle intermedie. Si noti che le forze di interazione esistono soltanto in movimenti coordinati con numerosi gradi di libertà: se i movimenti sono decomposti in sequenze di rotazione di singoli giunti, tali forze spariscono (sia pure alle spese della funzionalità e fluidità dei movimenti): quest’effetto può spiegare perché in numerose patologie neuro-motorie la segmentazione dei movimenti si manifesta come meccanismo di adattamento ad un deficit di controllo (diminuisce la fluidità ma elimina le forze di interazione). 4.2 Proprietà visco-elastiche dei muscoli e impedenza meccanica Una delle intuizioni fondamentali di Bernstein (1967) è stata l’osservazione che è impossibile capire il movimento senza tenere conto della meccanica e delle proprietà peculiari degli ‘attuatori’. Per comprendere le peculiarità dei muscoli intesi come dispositivi di attuazione, è utile confrontarli con i motori in corrente continua, un tipo di attuatore largamente utilizzato in robotica. Da un punto di vista puramente funzionale, le differenze sono sintetizzate in Figura 5. ---------------------Figura 5 ---------------------Come nei motori, nelle fibre muscolari la forza generata dipende dalla velocità; queste ultime differiscono dai primi per il fatto che la forza dipende anche dalla lunghezza (Hill 1938; Rack and Westbury 1969). Ciò implica che le fibre muscolari sono capaci di immagazzinare energia elastica, ossia sono assimilabili a ‘molle’. Se poi si tiene conto che i muscoli combinano molte fibre muscolari con orientazione e caratteristiche meccaniche differenti; che tendini e tessuto fibroso contribuiscono al comportamento meccanico complessivo; ed infine che i punti di origine e di inserzione e il percorso delle fibre sono geometricamente complessi, ne consegue che i contributi dei singoli muscoli al movimento del corpo si possono descrivere con una relazione fra forza, lunghezza e velocità estremamente complessa. Infine, i muscoli sono parte di circuiterie riflesse spinali (ad esempio, il riflesso di stiramento), per cui il livello di eccitazione dipende esso pure da allungamento e velocità di allungamento. Tali riflessi sono modulabili volontariamente, per cui è possibile variare il comportamento meccanico di un gruppo muscolare da prevalentemente elastico a prevalentemente viscoso (Winters 1995, Lin e Rymer 1998). In generale, è possibile esprimere il comportamento meccanico del sistema costituito dal muscolo e dai riflessi spinali con un’impedenza meccanica, cioè un operatore che specifica la forza generata in funzione dello stato meccanico e del comando discendente: f = f (l , l&, u ) (6) dove f è la forza esercitata dal muscolo, l è la lunghezza, l& è la velocità di accorciamento e u è l’insieme dei comandi neurali discendenti. Perché un sistema meccanico si possa considerare una ‘molla’, occorre che possa immagazzinare energia elastica, ossia che esista la quantità: E (l ) = −∫ f (l , l&, u ) ⋅ dl (7) Affinché questo avvenga, è sufficiente che la Eq. 6 sia integrabile. E’ poi sempre possibile linearizzare la Eq. 6 nell’intorno di un determinato punto di lavoro, definito dalla terna (l o , l&o , u o ) , per cui si ottiene: ∂f ∂f ∂f f = f (lo , l&o , u o ) + δl + δl& + δu & ∂l ∂u ∂l { { { k b (8) c dove le quantità k, b e c sono rispettivamente la rigidità (stiffness), la viscosità e il guadagno neurale. Da questa definizione risulta evidente che stiffness e viscosità sono proprietà ‘puntuali’ dell’impedenza meccanica, ossia dipendono dal punto di lavoro. Volendo interpretare il comportamento dell’intero corpo in risposta alle perturbazioni, occorre estendere la nozione di ‘molla’ al caso n-dimensionale (Hogan 1985). Si consideri un campo di forze, definito dalla relazione F = F ( X , X& ) , ossia una forza F, che dipende dalla posizione X ed eventualmente dalla velocità, X& . Il campo di forze definisce una ‘molla’ se è conservativo. In particolare, linearizzando nell’intorno di un punto Xo , si può scrivere F = − K ⋅ ( X − X o ) − B ⋅ X& e per avere la conservatività del campo occorre che la matrice K simmetrica, oltre ad essere definita positiva. (matrice di stiffness) sia In queste condizioni la matrice è anche diagonalizzabile ed ha autovalori positivi; di conseguenza può essere visualizzata come un ellisse: gli assi principali corrispondono agli autovettori (direzioni privilegiate in cui i vettori forza e spostamento sono collineari), e le lunghezze dei semiassi sono proporzionali agli autovalori (che dimensionalmente sono coefficienti di stiffness). Si consideri ad esempio l’arto superiore. Se la mano è nella posizione Xo , e le viene somministrata una perturbazione dX, il braccio risponde con una forza di richiamo F, che in generale non avrà la stessa direzione della perturbazione. E’ possibile stimare numericamente i coefficienti della matrice K e verificare se è simmetrica e definita positiva. Se questo è il caso, si può concludere che il braccio si comporta come un sistema conservativo (cioè, una molla) rispetto alle perturbazioni della mano, e l’ellisse di stiffness visualizza la struttura geometrica di K (Figura 6). ---------------------Figura 6 ---------------------Come si vede dalla figura, l’orientazione dell’ellisse di stiffness appare essere caratterizzata da un andamento polare, con l’asse maggiore (ossia la direzione in cui la mano è più rigida) allineato lungo la congiungente spalla-mano. La dimensione di tali ellissi può essere facilmente controllata volontariamente modulando il livello di coattivazione dei muscoli. Al contrario, l’orientazione non può essere facilmente modificata, con l’eccezione di movimenti altamente specializzati (Burdet e coll. 2001). 4.3 Conseguenze della visco-elasticità muscolare Le implicazioni della visco-elasticità del sistema muscolare sulle teorie del controllo motorio, apprezzate soltanto nei tardi anni ’70, sono ancora relativamente controverse. Innanzitutto, la visco-elasticità muscolare è alla base di una delle funzionalità più sofisticate del controllo motorio biologico, ossia la capacità di manipolare oggetti. E’ stato dimostrato in campo robotico che, affinché la manipolazione sia stabile, è necessario che il robot appaia all’interfaccia con l’ambiente esterno come un dispositivo ‘passivo’, ossia un dissipatore netto di energia. Se il comportamento all’interfaccia è di tipo conservativo, come avviene nel caso biologico, questa condizione è automaticamente verificata; per contro, lo stesso risultato è molto più difficile da ottenere in robotica se non emulando con complessi meccanismi di controllo le caratteristiche degli attuatori muscolari. Un’altra conseguenza della visco-elasticità muscolare, comprendendo le componenti riflesse spinali, è di implementare un sistema di controllo a feedback implicito (e istantaneo), che tende a contrastare l’azione di disturbi e carichi esterni e interni, come l’azione della gravità e la intrinseca dinamica delle masse corporee. La questione principale è la rilevanza quantitativa e funzionale di questo effetto: per alcuni ricercatori, la stiffness muscolare è tutto ciò che è necessario, senza bisogno di modelli dinamici interni, per la compensazione di disturbi interni ed esterni. E’ stato suggerito (Feldman 1966) che esso costituisca essenzialmente un controllore di posizione così che, per generare un movimento, al sistema nervoso sarebbe sufficiente specificare una traiettoria desiderata o ‘virtuale’, che costituirebbe il ‘punto di lavoro’ mobile di muscoli e riflessi. Questa ipotesi, nota come Ipotesi di Punto di Equilibrio (Equilibrium-Point Hypothesis), nelle sue varie formulazioni (Feldman 1966, Bizzi e coll. 1992, Feldman & Levin 1995) ha avuto grande influenza fino a metà degli anni ’90. A parte la sua eleganza e la attraente natura ecologica, la teoria sarebbe plausibile soltanto se i valori empirici della stiffness muscolare, all’equilibrio e durante il movimento, fossero sufficientemente elevati rispetto alla tipica dinamica del movimento. Molti sono stati i tentativi di stimare l’entità della stiffness, sia in condizioni statiche (Mussa Ivaldi e coll. 1985, Tsuji e coll. 1995) che dinamiche (Bennett e coll. 1992, Won e Hogan 1995, Gomi e Kawato 1996), ma, come dimostrato da paralleli studi modellistici (Gribble e coll. 1998), l’interpretazione dei risultati nasconde sottigliezze che non consentono una conclusione risolutiva. In ogni caso, quale che sia la risposta, molti studi hanno via via dimostrato che, in parallelo al controllo della stiffness, il sistema nervoso ha a disposizione altri meccanismi, che sono probabilmente più efficienti per i task dinamici più complessi. Ad esempio, è probabile che l’importanza relativa della stiffness sia maggiore in movimenti di minima ampiezza, come la scrittura corsiva, che coinvolgono masse relativamente piccole, che nel caso di ampi gesti sportivi, che possono coinvolgere masse elevate, alte velocità ed un elevato livello di accuratezza. In generale, a parte la stiffness, il problema dinamico inverso può essere risolto mediante meccanismi anticipativi (feedforward) o correttivi (feedback); vedi Figura 7. ---------------------Figura 7 ---------------------4.4 Meccanismi di controllo feedforward Uno schema di controllo feedforward (Figura 7, in alto) è basato sulla computazione preprogrammata (e quindi anticipativa) delle forze che saranno necessarie al sistema nell’esecuzione di un determinato piano motorio, senza l’utilizzo di informazioni sensoriali se non per la formulazione dello stato desiderato. Ciò corrisponde a risolvere l’equazione del moto (Eq. 5) rispetto alle coppie generate dagli attuatori e per fare questo è necessario che il sistema nervoso mantenga una rappresentazione interna o ‘modello’ inverso della fisica del corpo e degli attuatori. Un tale meccanismo di controllo è veloce e non corre il rischio dell’instabilità, ma ha un ovvio inconveniente: la sensibilità a disturbi imprevisti, a modificazioni del corpo (per esempio la presenza di utensili) e/o degli attuatori (per esempio, l’affaticamento). Ciò suggerisce che un controllore feedforward debba necessariamente avere caratteristiche adattative ed è stato proposto (Kawato e Gomi 1992) che una plausibile localizzazione di questi meccanismi adattativi sia la neocorteccia cerebellare. Gli stessi autori hanno inoltre proposto un modello di adattamento del modello interno che implementa il controllo feedforward. Il modello, denominato feedback error learning (Figura 8) è basato sulla cooperazione tra due meccanismi di controllo (uno a feedback, che opera nella fase iniziale dell’addestramento, ed uno a feedforward, che emerge nella fase successiva) e su una strategia di auto-apprendimento. In questo modello, l’errore di retroazione nel controllore a feedback (la discrepanza fra traiettoria desiderata e quella attuale) è utilizzato come segnale di apprendimento di un modello feedforward, che agisce in parallelo e prende gradualmente il posto del controllore a feedback mano a mano che l’errore di retroazione diminuisce, acquisendo quindi un modello interno inverso della dinamica del corpo. Occorre sottolineare che un tale schema di apprendimento non converge del caso di sistemi o carichi instabili, ad esempio nella stabilizzazione della stazione eretta (si vedano le sezioni seguenti). ---------------------Figura 8 ---------------------Diversi studi hanno mostrato che il sistema nervoso utilizza rappresentazioni interne per anticipare le conseguenze delle forze di interazione dinamica. In particolare, Lackner e Dizio (1994) hanno mostrato che il sistema nervoso è in grado di prevedere le forze centripete e di Coriolis; evidenze sperimentali dello stesso fenomeno, a livello delle attivazioni dei muscoli di spalla e gomito, sono state ottenute da Gribble e Ostry (1999). Analogamente, Flanagan e Wing (1997) hanno mostrato che nella prensione la forza di chiusura viene programmata in anticipo sulla forza di trazione; più di recente, Flanagan e Lolley (2001) hano mostrato che durante il trascinamento di un oggetto la forza incidente, che controlla l’attrito, viene programmata con grande precisione e in anticipo in modo da seguire l’andamento della forza tangenziale. Questi studi nel complesso suggeriscono che il sistema nervoso ha capacità sofisticate di controllo anticipativo, per cui sono necessari modelli interni accurati della dinamica del corpo e delle interazioni con l’ambiente. 4.5 Meccanismi di controllo a feedback Un ovvio inconveniente della modalità di controllo feedforward è che non è in grado di rispondere a perturbazioni inaspettate. Se queste possono essere misurate, o se più in generale sono disponibili informazioni sensoriali sull’evoluzione del movimento, queste possono essere utilizzate per effettuare correzioni ‘al volo’ del movimento stesso, in modo che questo segua il piano motorio desiderato (vedi Figura 7, in mezzo). Ciò corrisponde alla modalità di controllo a feedback. Il problema è che l’informazione sensoriale è disponibile con un ritardo non trascurabile (a parte il feedback implicito fornito dalla stiffness intrinseca dei muscoli) e questo pone seri problemi per la stabilità del controllo. Per fissare le idee, consideriamo un esempio molto semplice, ma con parametri abbastanza simili a diversi sottosistemi motori biologici: un sistema massa-molla, con una frequenza naturale f n = ω n / 2π =1 Hz ed un fattore di smorzamento ξ=0.5, sotto l’azione di un controllore proporzionale/derivativo (PD). Supponiamo che il rapporto tra i due guadagni (proporzionale e derivativo) sia 10:1 e determiniamo il guadagno complessivo di anello in modo che la precisione asintotica in anello chiuso nella risposta al gradino sia il 90%. Si tratta di un esercizio elementare di teoria dei controlli lineari. In particolare, il diagramma di Bode del sistema è quello indicato in Figura 9 e ci mostra che il margine di fase del controllo in catena chiusa è ϕ = 84o ad una pulsazione ω =36 rad/s. In queste condizioni il controllo in catena chiusa è stabile ed opera perfettamente. Tuttavia, se supponiamo che ci sia un ritardo T nell’anello di controllo, possiamo calcolare cosa cambia della stabilità del controllo. Infatti, il ritardo temporale introduce uno sfasamento negativo, linearmente dipendente dalla frequenza: ∆ϕ = −ωT . Si può quindi dedurre il valore limite del ritardo oltre il quale il controllo diventa instabile: nell’esempio tale valore risulta essere T=40 ms. In applicazioni robotiche non è difficile limitare il ritardo a valori che sono 1 o 2 ordini di grandezza inferiori, ma questo non accade nel caso biologico, in cui i ritardi si misurano in molte decine di millisecondi. Quindi un controllore PD biologico corre un serio rischio di essere instabile anche in casi apparentemente semplici e lontani dall’instabilità. ---------------------Figura 9 ---------------------4.6 Integrazione senso-motoria e filtro di Kalman Il problema della instabilità del controllo feedback può essere risolto fornendo al regolatore non l’informazione sensoriale, che è disponibile in ritardo, ma piuttosto una stima dello stato attuale, basata su informazioni presenti e passate. Almeno due sorgenti di informazioni possono essere utilizzate nella stima dello stato (posizione, velocità) del corpo: • le afferenze sensoriali (riafferenze) i comandi motori (copia efferente) Quest’operazione è un’integrazione senso-motoria che è alla base, per esempio, del concetto di corollary discharge precedentemente menzionato. Utilizzando il linguaggio della teoria dei controlli si può ricordare che se la dinamica del corpo è rappresentabile come un sistema dinamico lineare, con ingresso u, stato x ed uscita y, la soluzione ottima del problema dell’integrazione senso-motoria è data dal filtro di Kalman: xˆ i +1 = Axˆ i + Bu i + K i ⋅ [ y i − Cxˆ i ] (9) Il filtro definito da questa equazione ‘predice’ lo stato attuale sulla base di informazioni sensoriali ‘passate’ e contiene un modello interno (‘diretto’) del corpo. Il filtro di Kalman ha caratteristiche di ottimalità dal punto di vista matematico/statistico ma naturalmente la questione è la sua rilevanza per il modellamento dei meccanismi di integrazione senso-motoria che hanno luogo nel sistema nervoso. Per verificare questa possibilità, Wolpert e coll. (1995) hanno valutato la precisione con cui viene stimata la posizione del braccio durante movimenti in assenza di visione, in cui quindi le uniche informazioni disponibili sono la propriocezione e la copia efferente. Tali valori empirici sono stati paragonati con quanto predetto da un filtro di Kalman, nell’ipotesi che la precisione della stima vari con la durata del movimento (Figura 10): in entrambi i casi l’errore aumenta durante il primo secondo per poi tornare a diminuire e a mantenersi approssimativamente costante. L’effetto è quindi interpretabile con un’iniziale prevalenza della copia efferente nella determinazione della stima, che produce una accumulazione dell’errore; in seguito la componente sensoriale diventa sempre più affidabile e l’errore torna a diminuire. ---------------------Figura 10 ---------------------Un osservatore dello stato può essere utilizzato in uno schema di controllo a feedback, ed è in grado di eliminare le instabilità dovute ai ritardi di propagazione dell’informazione sensoriale (vedi Figura 7, in basso). Non ci sono prove dirette ed inequivocabili che il sistema nervoso utilizzi meccanismi a feedback basati su modelli interni che stimano lo stato presente sulla base di informazione sensoriale ‘passata’, ma ci sono numerose evidenze indirette: per esempio è stato mostrato (Desmurget & Grafton 2000) che in movimenti di reaching in cui il target viene spostato (target jump), la prima evidenza di correzione della traiettoria risale a non più di 110 ms dopo lo spostamento, un intervallo incompatibile con i ritardi sensoriali che sono molto maggiori. Il modello di controllo a feedback mediante osservatore dello stato ha un’altra proprietà. Se il guadagno del regolatore è infinito, la parte di regolatore che utilizza la copia efferente equivale a un controllo feedforward. Quindi lo schema di controllo a feedback basato sull’osservatore dello stato può essere in effetti interpretato come una combinazione ‘ottima’ di modalità di controllo feedback e feedforward. Un’altra classe di studi sperimentali ha in effetti mostrato come nel sistema nervoso convivano modalità di controllo feedforward e feedback, basate su modelli interni capaci di adattamento. Si tratta degli studi relativi all’apprendimento della dinamica di campi di forza artificiali, realizzati mediante interfacce aptiche robotizzate (Shadmehr e Mussa Ivaldi 1994), che hanno suggerito la compresenza delle due modalità di controllo (Sainburg e coll. 1999, Bhushan e Shadmehr 1999), sia pure con significative differenze. Si è verificato, per esempio, che hanno diverse velocità di adattamento: il controllo a feedback tende ad adattarsi più rapidamente del controllo feedforward (Thoroughman e Shadmehr 1999) in risposta a campi di forza mai prima sperimentati. Ciò suggerisce che le due modalità siano almeno in parte mediate da aree differenti del sistema nervoso. Infine, la coesistenza delle due modalità di controllo, getta nuova luce su una congettura di Woodworth (1899) secondo cui ‘il movimento è composto da due tipi di componenti: l’impulso iniziale e il controllo corrente. Il controllo corrente consiste in una sequenza di aggiustamenti più fini, aggiunti all’impulso iniziale via via che la mano si avvicina al target’. In effetti, i risultati illustrati in precedenza suggeriscono che almeno nei movimenti di reaching la fase iniziale è essenzialmente sotto controllo anticipativo; entra quindi in gioco la componente feedback, che prevale nella fase finale. 5. Disturbi della coordinazione L’ipotesi che il cervelletto sia dotato di competenze computazionali con riferimento alla ‘fisica’ del corpo (Marr, 1969; Ito, 1984; Kawato e Gomi, 1992; Braitenberg e coll 1997, Kawato 1999) ha suggerito che la circuiteria cerebellare svolga un ruolo cruciale nel controllo della dinamica. Lo studio delle sindromi cerebellari sembra quindi essere in grado di fornire importanti suggerimenti sui meccanismi neurali per il controllo della coordinazione senso-motoria. L’atassia è il sintomo principale di disfunzione cerebellare. Secondo la classica definizione di Holmes (1917, 1939), il termine indica una serie di problemi nella pianificazione e nell’esecuzione dei movimenti, comprendenti: (1) ritardo nell’inizio del movimento, (2) inaccuratezza nel raggiungimento di un target (dismetria), (3) incapacità di compiere movimenti a forza e/o ritmo costante (disdiadococinesìa), e (4) difficoltà a coordinare movimenti con più gradi di libertà (asinergia). Altri sintomi cerebellari sono la diminuita resistenza agli spostamenti passivi (ipotonìa) ed il tremore cinetico (un tipo di tremore presente soltanto durante i movimenti, che tende ad aumentare in ampiezza man mano che ci si avvicina al target). Altre patologie hanno sintomi interpretabili come disturbi della coordinazione; per esempio, l’assenza di propriocezione (Gordon e coll. 1995), la distonia (Inzelberg e coll. 1995) e la còrea di Huntington (Smith e coll. 2000). 5.1 Disfunzioni della componente anticipativa del controllo L’analisi di movimenti mono-articolari in pazienti con atassia cerebellare (Brown, e coll. 1990) rivela profili di velocità asimmetrici, con un aumento della durata della fase di decelerazione. Lo stesso fenomeno è stato osservato in movimenti a più gradi di libertà (Becker, e coll. 1990, 1991, Sanguineti e coll. 2003); vedi Figura 11. I sintomi sono molto più evidenti nei movimenti che coinvolgono molteplici gradi di libertà: incoordinazione di spalla e gomito, curvatura delle traiettorie della mano e dismetria (Bastian e coll. 1996). Questi autori hanno suggerito che l’asimmetria del profilo di velocità sia principalmente dovuta ad una scorretta temporizzazione fra le rotazioni delle diverse articolazioni, perchè le singole articolazioni esibiscono profili di velocità pressoché normali. ---------------------Figura 11 ---------------------Gli stessi autori hanno osservato, inoltre, che nei soggetti sani la coppia articolare totale è altamente correlata con le coppie di interazione (vedi Eq. 6), mentre in pazienti cerebellari tale correlazione è assente. Questo risultato può essere interpretato come dovuto a una compensazione difettosa delle coppie di interazione, le quali si verificano soltanto nei movimenti a più gradi di libertà. La decomposizione dei movimenti in segmenti in cui si muove un’articolazione alla volta (Bastian, e coll. 1996; Topka, e coll. 1998a,b), spesso osservabile nei soggetti cerebellari, è interpretabile come una strategia per eliminare le coppie di interazione. In effetti, le coppie di interazione esprimono l’accoppiamento dinamico fra le articolazioni dovuto alla meccanica del braccio, e disaccoppiare i movimenti dei vari gradi di libertà contribuisce a ridurne gli effetti. D’altra parte, la neutralizzazione delle coppie di interazione mediante decomposizione del movimento ha l’ovvio inconveniente di peggiorarne la ‘dolcezza’ globale. Infine, è stato rilevato (Massaquoi e Hallett 1996, Sanguineti e coll. 2003) che inaccuratezze nei movimenti, attribuibili alle coppie di interazione dinamica che almeno parzialmente vengono ignorate, sono osservabili anche in soggetti sani se il movimento è sufficientemente rapido, anche se la loro ampiezza è molto minore che nei soggetti cerebellari. In uno studio clinico volto a caratterizzare l’atassia cerebellare in termini di deficit di controllo, Sanguineti e coll. (2003) hanno rilevato (vedi Figura 11, in basso) che nella fase iniziale del movimento, presumibilmente controllata in modo feedforward, i soggetti cerebellari evidenziano un errore direzionale (o ‘di mira’, definito come l’angolo fra la direzione del target e quella della fase iniziale del movimento) che è significativamente maggiore di quello osservato in soggetti sani. L’errore di mira inoltre dipende dalla direzione del movimento: la Figura 11 (in basso) illustra, per ciascun soggetto, la relazione fra l’errore di mira e la direzione del movimento relativa alla direzione principale dell’ellisse di inerzia: si può vedere che l’errore tende ad annullarsi nella direzione principale, ed è caratterizzato da deviazioni laterali nelle altre direzioni, consistenti con le caratteristiche direzionali dell’inerzia. Il fatto che l’errore sia minimo nella direzione di massima inerzia, in cui il movimento richiede una maggiore forza, suggerisce, in particolare, che esso non possa essere interpretato come dovuto a un difetto di forza muscolare ma debba invece essere attribuito ad un controllo anticipativo difettoso. Per contro, nella loro fase finale gli stessi movimenti non differiscono significativamente da quelli dei soggetti normali, il che suggerirebbe che almeno nei soggetti cerebellari esaminati la modalità feedback del controllo sia preservata. 5.2. Disfunzioni della componente feedback del controllo Una situazione opposta è stata riscontrata in altre patologie che comportano un pesante coinvolgimento della coordinazione motoria, la còrea di Huntington, la distonia e l’assenza di propriocezione. In particolare, è stato mostrato (Smith e coll. 2000) che i sintomi iniziali della còrea di Huntington sono interpretabili come una anormalità nei meccanismi correttivi del controllo, il cui ruolo è prevalente durante la fase finale del movimento. Per quanto riguarda la distonia, sono stati rilevati un aumento di durata della fase di decelerazione del movimento (Inzelberg e coll. 1995), unita a un generale peggioramento della performance in assenza di visione, che ha suggerito problemi di integrazione senso-motoria. Siccome la còrea di Huntington produce una degenerazione del nucleo caudato, che fa parte dei nuclei della base, si potrebbe ipotizzare che la circuiteria relativa al controllo anticipativo sia probabilmente localizzata nel cervelletto, mentre quella relativa al controllo feedback coinvolga i nuclei della base ed il loop cortico-talamico. ---------------------Figura 12 ---------------------La Figura 12 riporta i risultati di uno studio (Gilman e coll. 1976) in cui sono stati studiati gli effetti sulla coordinazione dei movimenti dell’arto superiore di due tipi di lesioni: deafferentazione e decerebellazione1. A parziale conferma di quanto sopra riportato, si può vedere che la deafferentazione agisce soprattutto sulla fase finale del movimento, mentre la decerebellazione ne influenza la fase iniziale. 6. Controllo di sistemi instabili Negli ultimi anni c’è stato un certo interesse per i meccanismi di controllo di sistemi instabili, con particolare riferimento a due situazioni: - Stabilizzazione della stazione eretta (Winter e coll. 1998, Morasso & Schieppati 1999, Morasso & Sanguineti 2002, Baratto e coll. 2002, Loram e coll. 2001, Loram & Lakie 2002a); - Formazione di traiettorie della mano in un campo artificiale di forze di tipo instabile (Burdet e coll 2001). In entrambi i casi, l’instabilità è associata con l’esistenza di un potenziale che è massimo nell’intorno dello stato di riferimento e corrisponde quindi a un campo di forze divergente, che si oppone all’azione stabilizzante della stiffness muscolare. In generale, tenendo conto di quanto detto nelle sezioni precedenti, i possibili meccanismi di stabilizzazione di un carico instabile sono i seguenti: 1. Meccanismo riflesso, potenzialmente mediato dai numerosi feedback sensoriali disponibili; non è proponibile in questo contesto poiché i ritardi di propagazione nell’anello di controllo sono tali da peggiorare le condizioni di instabilità piuttosto che migliorarle. 2. Meccanismo legato alla stiffness: opera senza ritardo e può essere modulato agendo sul livello di coattivazione, che è applicata uniformemente a tutti i muscoli di un gruppo funzionale, oppure operando una ri-distribuzione delle attività per adattarsi in modo ottimo alle peculiarità del compito o carico. 3. Meccanismo di controllo feedforward/feedback basato su modelli interni, che per sua natura è di tipo integrativo e centrale; si basa su due tipi di modelli interni: a) un modello per la fusione multi-sensoriale, che possa compensare mediante predizione i ritardi di trasduzione e propagazione dell’informazione sensoriale; b) un modello per la generazione dei comandi motori che anticipi le conseguenze destabilizzanti del carico. 1 Con deafferentazione si intende una lesione di (alcune) radici dorsali del midollo spinale. In seguito a tale lesione il soggetto viene deprivato delle corrispondenti afferente sensoriali, provenienti dai fusi muscolari, dagli organi tendinei, dai recettori articolari e dai diversi tipi di recettori tattili. Con decerebellazione si intende l’ablazione (totale o parziale) della corteccia del cervelletto. In ogni caso, il campo divergente di forze può essere visto come una stiffness negativa ed il tasso di crescita di questo campo, fuori dal punto di equilibrio, definisce un livello critico di stiffness. Al di sopra questo livello, la sola stiffness è in grado di stabilizzare il sistema; al di sotto l’effetto della stiffness muscolare è insufficiente e deve essere complementato da un meccanismo di controllo di altro tipo, anticipativo o a feedback. 6.1 Stabilizzazione della stazione eretta: evidenza di compensazione anticipativa Nonostante la sua apparente semplicità, la natura dei meccanismi di controllo che permettono agli esseri umani di stare in piedi è tuttora oggetto di controversia. Chiaramente giocano un ruolo nel processo di stabilizzazione e diversi ricercatori hanno sottolineato il ruolo di uno o dell’altro. In particolare, è stato proposto da Winter e coll. (1998) un modello che attribuisce alla sola stiffness muscolare la capacità di risolvere il problema. Secondo questa teoria, l’intervento del sistema nervoso si limita alla selezione di un tono appropriato dei muscoli della caviglia e quindi la stabilizzazione sarebbe un fenomeno fondamentalmente passivo, senza alcuna componente di tipo attivo o reattivo. ---------------------Figura 13 ---------------------L’equazione di sistema del pendolo invertito umano (Figura 13, a sinistra) è la seguente: I pθ&& = mgh ⋅ sin (θ ) + τ a (10) dove θ è l’angolo di oscillazione posturale, m ed Ip sono la massa ed il momento di inerzia del corpo, h è la distanza del COM (Centro di Massa) dalla caviglia, g è l’accelerazione di gravità e τa è la coppia totale della caviglia. Sotto l’ipotesi che gli angoli di oscillazione siano piccoli si può dedurre dall’ eq. 5 il valore critico della stiffness: K c = mgh (11) Per piccole oscillazioni l’angolo θ varia proporzionalmente agli spostamenti del COM sulla base di appoggio y ≈ hθ con una banda di frequenza ben al di sotto di 1 Hz e tali oscillazioni sono associate a spostamenti (u) del centro di pressione (COP) che hanno un’ampiezza leggermente maggiore ed una larghezza della banda di frequenza significativamente maggiore (fig. 13, a destra; Baratto e coll. 2002). Si può dimostrare (Morasso & Schieppati 1999) che u è proporzionale alla coppia articolare della caviglia e che u ed y sono legate dall’equazione seguente: &y& = g ( y − u) h (12) In questa equazione y è la variabile controllata e u la variabile di controllo; sinteticamente si può dire che la differenza COM-COP è proporzionale all’accelerazione del COM. La figura 13 (pannello di destra) mostra la relazione tra le due curve che, pur avendo una banda di frequenza assai diversa, sono sostanzialmente in fase (il picco della correlazione si verifica per un ritardo praticamente nullo). Inoltre è stato dimostrato da Gatev e coll. (1999) che l’attività EMG dei muscoli della caviglia anticipa i pattern COM-COP e quindi non può essere determinata da riflessi segmentali. Una simulazione del pendolo invertito umano (Morasso & Sanguineti 2002), attivato da modelli muscolari realistici e compatibili con i dati sperimentali disponibili (Hunter & Kearney 1982), ha mostrato che il sistema non riesce ad essere stabilizzato dalle sole proprietà muscolari. Inoltre sono state effettuate delle stime dirette della stiffness articolare della caviglia (Loram & Lakie 2002b, Morasso e coll 2003) con approcci sperimentali molto diversi. In entrambi i casi i valori di stiffness stimati sono ben al di sotto del livello critico. La Figura 14 illustra il secondo approccio, basato su una base basculante motorizzata montata su una piattaforma di forza. Il motore genera piccole e rapide perturbazioni angolari (1o in circa 150 ms): i relativi spostamenti del COP (dopo una media sincronizzata con gli stimoli per eliminare l’effetto dell’oscillazione posturale sottostante) sono proporzionali alla stiffness angolare e possono quindi essere usati per una stima. ---------------------Figura 14 ---------------------- 6.2 Movimenti del braccio in un campo di forze divergente: evidenza di una modulazione della stiffness Nella manipolazione di oggetti o dispositivi, occorre controllare le forze determinate dall’interazione con l’ambiente fisico. Studi recenti indicano che questa compensazione è ottenuta mediante modelli interni della dinamica, cioè rappresentazioni neurali della relazione tra comando motorio e movimento (Lackner & Dizio 1994, McIntyre e coll. 1996, Kawato 1999, Thoroughman & Shadmehr 2000, Wolpert & Kawato 1998). In questi studi, le interazioni con l’ambiente fisico sono meccanicamente stabili e meccanismi di apprendimento come il feedback error learning sono in grado di acquisire un modello interno della dinamica inversa che può essere usato in uno schema di compensazione di tipo feedforward. Tuttavia, in tipici compiti della vita quotidiana (come mantenere un cacciavite nella fessura di una vite durante l’avvitamento) le forze di interazione hanno un andamento divergente rispetto al punto di lavoro e quindi corrispondono ad un compito instabile. Nella maggior parte dei casi, come si è avuto precedentemente occasione di argomentare al riguardo della stabilizzazione posturale, si possono escludere meccanismi di stabilizzazione di tipo riflesso lasciando quindi due sole possibilità, che peraltro non sono mutuamente esclusive ma possono avere un effetto sinergico: 1) una modulazione fine dell’impedenza meccanica del braccio, 2) un controllo anticipativo basato su modelli interni. Che il primo tipo di meccanismo possa risolvere il problema della stabilizzazione è stato dimostrato in uno studio recente (Burdet e coll. 2001) relativamente a movimenti planari del braccio, vincolato a muoversi sul piano orizzontale mentre impugna un manipolando robotizzato. Quest’ultimo era stato programmato in modo da generare un campo di forze divergente rispetto ad una traiettoria nominale (rettilinea in direzione antero/posteriore) ossia perpendicolare rispetto ad essa e con un’intensità proporzionale allo spostamento laterale: in altre parole, il campo di forze simula un pendolo invertito. In queste condizioni un soggetto normale è in grado di imparare, dopo un buon numero di ripetizioni, ad eseguire il movimento desiderato con spostamenti laterali assai piccoli ma il risultato principale dello studio è che questo adattamento si accompagna ad una modulazione e rotazione dell’ellisse di stiffness (optimal impedance matching): si passa da una orientazione polare (rispetto alla spalla) ad una orientazione perpendicolare rispetto alla traiettoria, che minimizza gli scostamenti da quest’ultima. Questa è evidentemente una strategia assai più complicata della semplice coattivazione di tutti i muscoli, che aumenterebbe la dimensione dell’ellisse di stiffness senza alterarne l’orientazione e che quindi risulterebbe meno precisa e più dispendiosa metabolicamente. Tuttavia rimane da dimostrare se la strategia dell’optimal impedance matching sia effettivamente un approccio risolutivo di tipo generale o sia piuttosto un meccanismo particolare principalmente finalizzato all’apprendimento di gesti specializzati per specifichi contesti dinamici. Questo problema è stato affrontato in uno studio pilota (Morasso e coll. 2002) in cui un pendolo invertito fisico (non simulato con un campo di forza programmato) è afferrato dal soggetto a diverse altezze. Il compito è semplicemente quello di mantenere il pendolo in equilibrio e le modalità di stabilizzazione sono state quantificate misurando gli angoli di oscillazione del pendolo e l’attività elettromiografica di diversi muscoli del braccio. In questa situazione sperimentale è possibile dimostrare che il valore critico di stiffness della mano per la stabilizzazione del pendolo di massa m e di altezza h dipende dal punto di afferramento (distanza d) secondo la relazione seguente: Kc > mgh d2 (13) Durante gli esperimenti sono stati mantenuti costanti i valori di m e di h, mentre si è variato il valore di d chiedendo al soggetto di afferrare il pendolo in diverse posizioni. Pertanto è possibile discriminare due possibili regimi di controllo a seconda che, per una data posizione di afferramento, il valore critico sia superiore o inferiore rispetto ai valori fisiologici della stiffness della mano (Tsuji e coll. 1995). Nel primo caso, che è certamente fisicamente più impegnativo, il sistema non ha altra scelta che puntare su un controllo anticipativo, per complementare le carenze dovute ad una stiffness insufficiente. Puntualmente i dati confermano tale considerazione, mostrando un’attivazione muscolare senza evidenza di coattivazione e sincronizzata con le oscillazioni del pendolo. Tuttavia un pattern di controllo del tutto simile è stato riscontrato anche nel caso che la distanza d sia sufficientemente grande da far scendere il valore critico di stiffness al di sotto dei valori fisiologicamente raggiungibili. Quindi la modulazione della stiffness, al contrario di quanto trovato da Burdet e coll. (2001), non sembra essere in questo caso il meccanismo principale di stabilizzazione. 6.3 Possibili criteri di scelta tra modulazione della stiffness e compensazione anticipativa L’evidenza sperimentale presentata nelle due precedenti sezioni è in una certa misura contraddittoria. In un caso, controllo posturale, sembra appurato che il livello fisiologico della stiffness articolare della caviglia sia insufficiente a stabilizzare il corpo eretto e quindi l’unica soluzione possibile è l’approntamento di modelli interni per un controllo anticipativo. Negli altri due casi, che riguardano l’arto superiore e che implicano valori critici di stiffness compatibili con le caratteristiche viscoelastiche dei muscoli, la soluzione adottata dal cervello sembra dipendere dal compito: a) modulazione della stiffness nel caso di movimenti in un campo di forze artificiale divergente, b) compensazione anticipativa nel caso di stabilizzazione manuale di un pendolo invertito. Da cosa può dipendere tale differenza? Consideriamo, in generale, la dinamica della ‘caduta’ che sottintende a tutti i paradigmi considerati. L’eq. 11 si riferisce specificamente al caso della postura eretta ma, con piccole variazioni, si può applicare a tutti i carichi instabili in cui si possa evidenziare un punto di equilibrio instabile ed un capo di forze divergente: &x& = αx − u , dove α è parametro (positivo) che dipende dalla struttura del carico instabile ed u è la variabile di controllo. Se consideriamo la corrispondente funzione di trasferimento, troviamo che ci sono due poli, entrambi reali: p = ± α . Quello positivo è la sorgente di instabilità e, in assenza di azioni correttive, determina una “caduta” ad andamento esponenziale a partire dallo stato di equilibrio ( x = 0 ): la costante di tempo meccanica, caratteristica della caduta, è T = 1 / α . Riprendiamo in esame i tre casi considerati sotto questo punto di vista: - Nel caso della postura eretta α = g / h e per un valore tipico h = 1 m si ha T = 320 ms ; - Nel caso del pendolo invertito stabilizzato manualmente (altezza del pendolo h = 1.8 m) vale ancora α = g / h e pertanto T = 430 ms ; - Nel caso dei movimenti del braccio nel campo di forza artificiale α = K field / M dove K field è la costante elastica del campo e M è la massa apparente del braccio nella direzione del campo: negli esperimenti considerati se ne deduce che la costante di tempo è T ≈ 70 ms . Si può pertanto osservare che nei due casi in cui c’è evidenza di controllo anticipativo la costante di tempo meccanica è assai maggiore che nel caso in cui la strategia di controllo adottata è la modulazione della stiffness. Questo risultato può allora essere spiegato considerando che la compensazione anticipativa deve avere abbastanza tempo per recuperare i ritardi intrinseci delle riafferenze sensoriali (che sono dell’ordine di 100 ms) al fine di generare comandi anticipativi funzionalmente efficaci. I successivi episodi di caduta incipiente caratteristici dell’oscillazione posturale sono statisticamente indipendenti, perché la direzione di caduta è casuale ed imprevedibile, e quindi il processo di previsione deve essere riazzerato dopo ogni episodio. Pertanto, la compensazione anticipativa in compiti instabili può avere successo a condizione che l’orizzonte temporale critico, prima cioè di una caduta catastrofica, sia significativamente maggiore di 100 ms. In effetti, se consideriamo una varietà di compiti di stabilizzazione, come camminare sui trampoli o su un filo teso, bilanciare un bastone sulla mano ecc., è facile riconoscere che lo scopo di normali manovre di miglioramento della stabilità, come allargare le braccia o tenere dei lunghi bilancieri, è proprio quello di aumentare il “tempo di caduta” naturale, dando perciò più tempo al modello interno di generare appropriati aggiustamenti stabilizzatori. Riferimenti bibliografici Baratto L, Morasso P, Re C, Spada G (2002) A new look at posturographic analysis in the clinical context, Motor Control, 6, 248-273. Bastian AJ, Martin TA, Keating JG, Thach WT (1996) Cerebellar Ataxia: abnormal control of interaction torques across multiple joints. Journal. of Neurophysiology, 76, 492-509. Becker WJ, Kunesch E, Freund HJ (1990) Co-ordination of a multi-joint movement in normal humans and in patients with cerebellar dysfunction. Canadian Journal of Neurological Sciences, 17, 264274. Becker WJ, Morrice BL, Clark AW, Lee RG (1991) Multi-joint reaching movements and eye-hand tracking in cerebellar incoordination: investigation of a patient with complete loss of Purkinje cells. Canadian Journal of Neurological Sciences, 18, 476-87. Bennett DJ, Hollerbach JM, Xu Y, Hunter IW (1992) Time-varying stiffness of human elbow joint during cyclic voluntary movement. Experimental Brain Research 88, 433-42. Bernstein NA (1967) The coordination and regulation of movement. Pergamon Press, New York. Bhushan N, Shadmehr R (1999) Computational nature of human adaptive control during learning of reaching movements in force fields. Biological Cybernetics, 81, 39-60. Bizzi E, Hogan N, Mussa Ivaldi FA, Giszter SF (1992) Does the nervous system use equilibrium-point control to guide single and multiple movements? Behavioral and Brain Sciences, 15, 603-613. Braitenberg V, Heck D, Sultan F (1997) The detection and generation of sequences as a key to cerebellar function: experiments and theory. Behavioral and Brain Sciences 20, 229-245. Brown SH, Hefter H, Mertens M, Freund HJ (1990) Disturbances in human arm trajectory due to mild cerebellar dysfunction. Journal of Neurology, Neurosurgery and Psychiatry, 53, 306-313. Burdet E, Osu R, Franklin DW, Milner TE, Kawato M (2001) The central nervous system stabilizes unstable dynamics by learning optimal impedance. Nature, 414, 446-449. Chiel HJ, Beer RD (1997) The brain has a body: adaptive behavior emerges from interactions of nervous system, body and environment. Trends in Neuroscience, 20, 553-557. DeMarse TB, Wagenaar, DA, Blau AW, Potter SM (2001) The Neurally Controlled Animat: Biological Brains Acting with Simulated Bodies, Autonomous Robots, 11, 305-310. Descartes R (1969) Il mondo. L’uomo. Trad. di M. Garin, Laterza, Bari. Desmurget M, Grafton S (2000) Forward modeling allows feedback control for fast reaching movements. Trends in Cognitive Sciences, 4, 423-431. Feldman AG (1966) Functional tuning of the nervous system with control of movement or maintenance of a steady posture: 2. Controllable parameters of the muscle. Biophysics, 11, 565578. Feldman AG, Levin MF (1995) The origin and use of positional frames of references in motor control. Behavioral and Brain Sciences, 18, 723-745. Fitts PM (1954) The information capacity of the human motor system in controlling the amplitude of movement. Journal of. Experimental Pshychology, 47, 381-391. Flanagan JR, Wing AM (1997) The role of internal models in motion planning and control: evidence from grip force adjustments during movements of hand-held loads. Journal of Neuroscience, 17, 1519-1528. Flanagan JR, Lolley S (2001) The inertial anisotropy of the arm is accurately predicted during movement planning. J. Neuroscience, 21(4), 1361-1369. Flash, T. and N. Hogan, N. (1985) The coordination of arm movements: an experimentally confirmed mathematical model. Journal of Neuroscience, 7, 1688-1703. Gatev P, Thomas S, Kepple T, Hallet M (1999) Feedforward ankle strategy of balance during quiet stance in adults. Journal of Physiology, 514, 915-928. Gibson JJ (1966) The senses considered as perceptual systems. Houghton Mifflin, Boston. Gilman S, Carr D, Hollenberg J (1976) Kinematic effects of deafferentation and cerebellar ablation. Brain, 99, 311-330. Georgopoulos A, Schwartz A, Kettner R. (1986) Neuronal population coding of a movement direction. Science, 233, 1416-1419. Gomi H, Kawato M (1996) Equilibrium-point control hypothesis examined by measured arm stiffness during multijoint movement. Science 272, 117-120. Gordon J, Ghilardi MF, Ghez C (1995) Impairments of reaching movements in patients without proprioception. I. Spatial errors. Journal of Neurophysiology, 73, 347-360. Gribble PL, Ostry DJ (1996) Origins of the power law relation between movement velocity and curvature: modeling the effects of muscle mechanics and limb dynamics. Journal of Neurophysiology, 76, 2853-2860. Gribble PL, Ostry DJ, Sanguineti V, Laboissiere R (1998) Are complex control signals required for human arm movement? J Neurophysiology, 79, 1409-1424. Gribble PL, Ostry, DJ (1999) Compensation for interaction torques during single and multijoint limb movement. Journal of Neurophysiology, 82, 2310-2326. Grillner S (1981) Control of locomotion in bipeds, tetrapods, and fish. In: Handbook of physiology: the nervous system. Vol. 2. Motor Control. (Brooks VB editor), Williams & Wilkins, Baltimore, 1179-1236. Harris CM, Wolpert DM (1998) Signal-dependent noise determines motor planning. Nature, 394, 780784. Hill AV (1938) The heat of shortening and the dynamic constants of muscle. Proceedings of the Royal Society of London, B126, 136-195. Hogan N (1985) The mechanics of multi-joint posture and movement control. Biological Cybernetics, 52, 315-331. Holmes G (1917) The symptoms of acute cerebellar injuries due to gunshot injuries. Brain, 40, 461535. Holmes G (1939) The cerebellum of man. (The Hughlings Jackson Memorial Lecture.) Brain, 62, 130. Jackson JH (1873) On the anatomical and physiological localization of movements in the brain. The Lancet, ristampato in Selected writings of John Hughlings Jackson (1958) J. Taylor editor, Staple Press, London. Holst E, von, Mittelstaedt H (1950) Das Reafferenzprinzip. Wechselwirkungen zwischen Zentralnervensystem und Peripherie. Natur-wissenschaften, 37, 464-476. Hunter IW, Kearney RE (1982) Dynamics of human ankle stiffness: variation with mean ankle torque. Journal of Biomechanics, 15, 747-752. Hyman R (1953) Stimulus information as a determinant of reaction time. Journal of Experimental Psychology, 45, 188-196. Inzelberg R, Flash T, Schechtman E, Korczyn AD (1995) Kinematic properties of upper limb trajectories in idiopathic torsion dystonia. Journal of Neurology, Neurosurgery, Psychology, 58, 312-319. Ito, M. (1984) The cerebellum and neural control. Raven Press, New York. Kawato M, Gomi, H (1992) A computational model of four regions of the cerebellum based on feedback error learning. Biological Cybernetics, 69, 95-103. Kawato M (1999) Internal models for motor control and trajectory planning. Current Opinions in Neurobiology, 9, 718-727. Keele S (1968) Movement control in skilled motor performance. Psychological Bullettin, 70, 387:403. Krakauer JW, Ghilardi MF, Ghez, C (1999) Independent learning of internal models for kinematic and dynamic control of reaching. Nature Neuroscience, 2, 1026-1031. Lackner JR, Dizio P (1994) Rapid adaptation to Coriolis force perturbations of arm trajectory. Journal of Neurophysiology, 72, 299-313. Lin DC, Rymer WZ (1998) Damping in reflexively active and areflexive lengthening muscle evaluated with inertial loads. Journal of Neurophysiology, 80, 3369-3372. Loram ID, Kelly S, Lakie, M (2001) Human balancing of an inverted pendulum: is sway size controlled by ankle impedance? Journal of. Physiology, 532, 879-891. Loram ID, Lakie M (2002a) Human balancing of an inverted pendulum: position control by small, ballistic-like, throw and catch movements. Journal of Physiology, 540, 1111-1124. Loram ID, Lakie M (2002b) Direct measurement of human ankle stiffness during quiet standing: the intrinsic mechanical stiffness is insufficient for stability. Journal of Physiology, 545, 1041-1053.. Marr D (1969) A theory of cerebellar cortex. Journal of Physiology, 202, 437-470. Massaquoi S, Hallett M (1996) Kinematics of initiating a two-joint arm movement in patients with cerebellar ataxia. Canadian Journal of Neurological Science, 23, 3-14. McIntyre J, Mussa-Ivaldi F A, Bizzi, E (1996) The control of stable postures in the multijoint arm. Experimental Brain Research, 110, 248-264. Morasso P (1981) Spatial control of arm movements. Experimental Brain Research, 42, 223-227. Morasso P, Mussa Ivaldi FA (1982) Trajectory formation and handwriting: a computational model. Biological Cybernetics, 45, 131-142. Morasso P (1983) Three dimensional arm trajectories. Biological Cybernetics, 48, 187-194. Morasso P, Schieppati M (1999) Can muscle stiffness alone stabilize upright standing? Journal of Neurophysiology, 83, 1622-1626. Morasso P, Sanguineti V (2002) Ankle stiffness alone cannot stabilize upright standing. Journal of Neurophysiolog,y, 88, 2157-2162. Morasso P, Re C, Sanguineti V (2002) A pilot study of the mechanisms of stabilization of the inverted pendulum. Gait & Posture, 16, suppl 1, S209-210. Morasso P, Casadio M, Re C, Sanguineti, V (2003) Motor control mechanisms in unstable tasks. XVII IMEKO World Congress June 22−27, Dubrovnik, Croatia. Mussa-Ivaldi FA, Hogan N, Bizzi E (1985) Neural, mechanical, and geometric factors subserving arm posture in humans. Journal of Neuroscience, 5, 2732-2743. Mussa Ivaldi F A, Morasso P, Zaccaria R (1988) Kinematic Networks. A Distributed Model for Representing and Regularizing Motor Redundancy. Biological Cybernetics, 60, 1-16. Piaget J (1963) The origin of intelligence in children. Norton Press, New York. Rack PMH, Westbury DR (1969) The effects of length and stimulus rate on tension in isometric cat soleus muscle. Journal of Physiology, 204, 443-460. Reger BD, Fleming KM, Sanguineti V, Alford S, Mussa-Ivaldi FA (2000) Connecting Brains to Robots: An Artificial Body for Studying the Computational Properties of Neural Tissues. Artificial Life, 6, 307–324. Rosenbaum DA (1991) Human motor control. Academic Press, New York. Sainburg RL, Ghez C, Kalakanis D (1999) Intersegmental dynamics are controlled by sequential anticipatory, error correction, and postural mechanisms. Journal of Neurophysiology, 81, 10451056. Sanguineti V, Morasso P, Baratto L, Brichetto G, Mancardi GL., Solaro, C (2003) Cerebellar ataxia: Quantitative assessment and cybernetic interpretation. Human Movement Science, 22, 189–205. Shadmehr R, Mussa-Ivaldi FA (1994) Adaptive representation of dynamics during learning of a motor task. Journal of Neuroscience, 14, 3208-3224. Sherrington CS (1906) The Integrative Action of the Nervous System. Cambridge University Press, Cambridge. Smith MA, Brandt J, Shadmehr R (2000) Motor disorder in Huntington's disease begins as a dysfunction in error feedback control. Nature, 403, 544-549. Thoroughman KA, Shadmehr R (1999) Electromyographic Correlates of Learning an Internal Model of Reaching Movements. Journal of Neuroscience, 19, 8573–8588. Thoroughman KA, Shadmehr R (2000) Learning of action through adaptive combination of motor primitives. Nature, 407, 742-747. Topka H, Konczak J, Dichgans J (1998a) Coordination of multi-joint arm movements in cerebellar ataxia: analysis of hand and angular kinematics. Epxerimental Brain Research, 119, 483-492. Topka H, Konczak J, Schneider K, Boose A, Dichgans J (1998b) Multijoint arm movements in cerebellar ataxia: abnormal control of movement dynamics. Experimental Brain Research, 119, 493-503. Tsuji T, Morasso P, Goto K, Ito K (1995) Human hand impedance characteristics during maintained posture. Biological Cybernetics, 72, 475-485. Uno Y, Kawato M, Suzuki R (1989) Formation and control of optimal trajectory in human multijoint arm movement: Minimum torque-change model. Biological Cybernetics, 61, 89-101. Wessberg J, Stambaugh CR, Kralik JD, Beck PD, Laubach M, Chapin JK, Kim J, Biggs SJ, Srinivasan MA, Nicolelis MA (2000) Real-time prediction of hand trajectory by ensembles of cortical neurons in primates. Nature, 408, 361-365. Wilson DM (1961) The central nervous control of flight in a locust. Journal of Experimental Biology, 38, 471-490. Winter DA, Patla AE, Riedtyk S, Ishac MG (1998) Stiffness control of balance in quiet standing. Journal of Neurophysiology, 80, 1211-1221. Winters JM (1995) How detailed should muscle models be to understand multi-joint movement coordination. Human Movement Science, 14, 401-442. Wolpert DM, Ghahramani Z, Jordan MI (1995) An internal model for sensorimotor integration. Science,. 269,1880-1882. Wolpert DM, Kawato M (1998) Internal models of the cerebellum. Trends in Cognitive Science, 2, 338-347. Won J, Hogan N (1995) Stability properties of human reaching movements. Experimental Brain Research, 107, 125-136. Woodworth RS (1899) The accuracy of voluntary movement. Psychological Review Monograph Supplements, 3, no. 3. FIGURA 1 Decomposizione logica della generazione di un movimento in una sequenza di processi computazionali FIGURA 2 Nei movimenti di reaching, le traiettorie della mano sono rettilinee e con un profilo di velocità a campana, indipendentemente da direzione e ampiezza del movimento (da Morasso 1981) FIGURA 3. Forze interne ed esterne in una catena cinematica. Fext è il carico applicato all’effettore terminale e τ i sono le coppie generate dagli attuatori. Nel paradigma di moto passivo, Fext è definite dalla traiettoria pianificata e i τ i corrispondono alla “compliance” passiva delle articolazioni in risposta alla ‘trazione’ pianificata. FIGURA 4. Forze di interazione dinamica nei movimenti di un braccio planare a due gradi di libertà. A partire dalla posizione di partenza indicata a sinistra (50 cm dalla spalla, con il gomito flesso a 90°), sono stati considerati 8 diversi movimenti in direzioni spaziate di 45°. Le traiettorie sono state generate utilizzando il modello minimum-jerk (vedi testo; durata: 0.7s, ampiezza 20 cm). A destra sono visualizzate le corrispondenti coppie generate dagli attuatori, visualizzate come forze equivalenti applicate alla mano. Parametri del modello: braccio: massa 2 kg, lunghezza 30 cm; avambraccio: massa 2 kg, lunghezza 40 cm. FIGURA 5. Confronto fra le proprietà meccaniche di un motore a corrente continua (in alto) e di un muscolo (in basso). La figura riporta gli andamenti delle caratteristiche sforzo-flusso (ossia, forzavelocità generalizzate) e sforzo-spostamento FIGURA 6. Schema concettuale del procedimento per la stima della stiffness della mano. Come mostrato a sinistra, un manico impugnabile trasmette alla mano piccole e rapide perturbazioni di posizione dX per mezzo di un braccio robotizzato, a partire da una configurazione di equilibrio prefissata. La corrispondente forza di richiamo, dF, viene misurata mediante un sensore di forza e la misura è ripetuta per diverse direzioni. I dati così ottenuti vengono utilizzati per il fitting di un modello dinamico lineare del 2° ordine (ossia un sistema massa-molla smorzato), che risulta in una stima della matrice di stiffness, K, di viscosità, B e di inerzia, M. A destra è indicata mediante un ellisse la struttura geometrica della matrice di stiffness (ellisse di stiffness) per diverse configurazioni del braccio. FIGURA 7. Schemi di controllo alternativi. In alto: controllo feedforward, basato su un modello interno (inverso) della dinamica. Al centro: controllo a feedback con ritardo. In basso: controllo a feedback che utilizza un osservatore dello stato, alimentato con riafferenze sensoriali e copia efferente. FIGURA 8. Modello di apprendimento feedback error learning. Il “feedback controller” è un regolatore standard, per esempio di tipo proporzionale/derivativo, e genera il “feedback motor command” che agisce anche da segnale di addestramento per il “feedforward controllor” unitamente ad una copia della traiettoria desiderata (“desired trajectory”) e di quella effettiva (“actual trajectory”). Il “motor command” complessivo è la somma dei due comandi motori: all’inizio dell’addestramento prevale il comando feedback e alla fine quello feedforward. Nell’interpretazione neurobiologica il controllore feedforward è localizzato nella “cerebellar cortex”; i neuroni nascosti corrispondono alle cellule granulari e i neuroni d’uscita alle cellule di Purkinje; i segnali di ingresso alla rete sono portati dalle fibre muschiate e i segnali di addestramento dalle fibre rampicanti, che utilizzano per come segnali di addestramento gli spike complessi. FIGURA 9. Diagramma di Bode relativo a un sistema massa-molla smorzato, controllato mediante un controllore PD. Il margine di fase viene calcolato considerando la pulsazione a cui l’ampiezza è 0 dB (nel diagramma, 36 rad/s) e misurando la differenza fra il valore critico della fase (-180°) e il suo valore attuale. A questa frequenza il margine di fase è 84°. La stabilità richiede un margine di fase positivo; esso inoltre deve essere superiore a 45° affinché lo smorzamento sia sufficiente. FIGURA 10. Precisione della stima della posizione di un braccio in movimento in assenza di visione, in funzione della durata del movimento (Wolpert e coll. 1995). A sinistra: andamento predetto da un modello dell’integrazione senso-motoria basato su un filtro di Kalman. L’errore tende inizialmente a crescere perché nella stima prevale il contributo della copia efferente, che produce una accumulazione dell’errore; in seguito la componente sensoriale diventa sempre più affidabile e l’errore torna a diminuire. A destra, l’andamento osservato sperimentalmente. FIGURA 11. Movimenti planari dell’arto superiore in soggetti cerebellari. In alto: traiettorie della mano e profili di velocità tipici, relativi a un soggetto sano (a sinistra) e uno con atrofia cerebellare degenerativa (a destra). In basso, da sinistra a destra: orientazione dell’ellisse di inerzia e dipendenza dell’errore di mira dalla direzione del movimento rispetto all’asse principale dell’ellisse di inerzia, in soggetti di controllo e in soggetti cerebellari (da Sanguineti e coll. 2003). FIGURA 12. Effetto di lesioni al sistema nervoso sulla coordinazione (da Gilman e coll. 1976). In alto, apparato e task sperimentale. In basso, da sinistra a destra: traiettoria della mano di un soggetto intatto (CO), deafferentato (DA), decerebellato (DB) , e deafferentato e decerebellato. FIGURA 13. Controllo della stazione eretta. A sinistra: modello a pendolo invertito (COM: centro di massa; COP: centro di pressione). A destra: oscillazioni di COM e COP nel piano sagittale. Figure 14. Piattaforma motorizzata rotante, montata sopra una piattaforma di forza. A sinistra: apparato sperimentale. A destra: rotazione θ(t) della caviglia e spostamento y(t) del COP. Durante una rapida rotazione della piattaforma ( ∆θ = 10 , ∆T = 150 ms ), il COM è praticamente costante e lo spostamento del COP ( ∆y ) può essere completamente attribuito alla stiffness della caviglia, la quale può essere stimata mediante l’equazione: mg∆y = K s ∆θ .