Paradigmi di Controllo Motorio

Transcript

Paradigmi di Controllo Motorio
Paradigmi di Controllo Motorio
Pietro G. Morasso e Vittorio Sanguineti
Dipartimento di Informatica, Sistemistica, Telematica (DIST)
Università di Genova
Via Opera Pia 13, I-16145 Genova, ITALIA
E-mail: [email protected], [email protected]
In “Bioingegneria della postura e del movimento” (A. Cappello, A. Cappozzo e P. di
Prampero editori), Patron Editore, Bologna, 2003, pp. 307-338.
1. Introduzione
Comprendere le modalità secondo cui gli esseri umani coordinano i movimenti, sia quelli
apparentemente semplici della vita quotidiana sia quelli ‘estremi’, in campo sportivo o artistico, è
un importante obiettivo scientifico con rilevanti implicazioni mediche, psicologiche,
cinesiologiche, cibernetiche.
Per ‘controllo motorio’ intendiamo la capacità del sistema nervoso di regolare o dirigere il
movimento. Quest’ultimo è spesso descritto nel contesto dell’esecuzione di una particolare azione;
quando si studia il controllo motorio, lo si fa in relazione ad azioni specifiche: cammino, corsa,
raggiungimento (reaching), fonazione, controllo della stazione eretta. In pratica si studia come
viene controllato il movimento nel contesto di una specifica attività, assumendo che ciò fornisca
informazioni sui principi generali. Il movimento, poi, non può essere studiato senza tenere conto
della percezione.
Per ‘percezione’ si intende l’integrazione dei dati grezzi sensoriali in informazioni fruibili
cognitivamente. E’ importante sottolineare che percezione e azione sono essenziali l’una all’altra:
la percezione, cioè, non è un meccanismo passivo, ma attivo, che mira ad anticipare le
conseguenze sensoriali di un’azione, legando quindi le informazioni sensoriali e i comandi motori
in un ‘tessuto computazionale’ coerente.
I sistemi sensoriali/percettivi forniscono informazioni sullo stato del corpo (ad esempio, la
posizione del corpo nello spazio) e sulle caratteristiche dell’ambiente, critiche per la regolazione
del movimento (ad esempio, la presenza di ostacoli).
Un ultimo aspetto, non meno importante dei precedenti, è il legame del movimento con processi
cognitivi quali l’attenzione, la motivazione, le emozioni; sono questi ultimi a determinare la
formazione dell’intento o obiettivo del movimento.
In questo capitolo verranno affrontate alcune questioni fondamentali per la comprensione del
controllo neurale dei movimenti: (i) Come fa il sistema nervoso a organizzare i singoli muscoli e
articolazioni in movimenti coordinati? (il cosiddetto problema dei gradi di libertà, Bernstein
1967); (ii) Come viene utilizzata l’informazione sensoriale relativa all’ambiente esterno e allo
stato del corpo stesso per selezionare e controllare il movimento? Ossia, che ruolo ha la percezione
nel controllo dei movimenti?
1.1. Teorie del controllo motorio
L’evoluzione delle conoscenze sulla struttura e sull’organizzazione del sistema nervoso ha via via
ispirato nuove ‘teorie’ del controllo motorio, intese come schemi concettuali in grado di fornire
una immagine coerente delle osservazioni sperimentali. Ne presentiamo un elenco sintetico, in
ordine approssimativamente cronologico.
•
Teorie basate sui riflessi.. Si richiamano alla nozione di arco riflesso, tradizionalmente
attribuita a Cartesio (Descartes 1662) e si basano sull’ipotesi di Sherrington (1906) che i
riflessi abbiano una funzione integrativa, ossia che rappresentino gli elementi costitutivi dei
comportamenti complessi. In altre parole, un comportamento motorio complesso sarebbe
interpretabile come una concatenazione di riflessi elementari.
•
Teorie gerarchiche. Ispirate alle teorie evoluzionistiche, si basano sull’osservazione di John
Hughlings Jackson (1873) che il sistema nervoso è organizzato come una gerarchia,
comprendente livelli superiori, intermedi e inferiori di controllo (rispettivamente, le aree
corticali associative, la corteccia motoria ed il midollo spinale). Nella sua evoluzione, il
controllo nervoso passerebbe da uno stato più semplice, in cui prevalgono i centri inferiori
altamente organizzati, ad uno stato più complesso, in cui prendono il sopravvento i centri
superiori paradossalmente meno organizzati perché più flessibili, e quindi il controllo si
trasforma da ‘automatico’ a ‘volontario’. Le patologie sarebbero interpretabili come una
‘dissoluzione’ ossia come una inversione dell’evoluzione. Un’ulteriore evoluzione delle teorie
gerarchiche e di quelle basate sui riflessi è la cosiddetta teoria riflesso/gerarchica secondo cui i
movimenti sarebbero interpretabili come gerarchie di riflessi.
•
Teorie dei programmi motori. Traggono origine dalla scoperta (Wilson 1961, Grillner 1981)
che i movimenti ciclici (la locomozione, ad esempio) sono controllati da generatori di ‘ritmi’
(central pattern generator, CPG) che dipendono debolmente dal controllo centrale o da
stimoli sensoriali. Ciò ha spostato l’enfasi dai comportamenti reattivi ai comportamenti
‘attivi’, non necessariamente originati da stimoli sensoriali. La nozione di generatore di ritmi
si è in seguito evoluta in quella, più astratta e generale, di ‘programma motorio’ (Keele 1968).
Per programma motorio si intende una ‘rappresentazione mentale’ astratta di una certa azione,
invariante rispetto agli aspetti geometrici e dinamici relativi alla sua traduzione in movimento.
A parziale supporto di questo punto di vista, è stato ad esempio rilevato come alcune
caratteristiche individuali della scrittura corsiva siano invarianti rispetto alla scala (nella
scrittura su un foglio di carta o su una lavagna, per esempio), al tipo di utensile (penna, gesso o
altro) e al tipo di effettore (mano, piede, testa) (Rosenbaum 1991).
•
Teorie cibernetiche. Potrebbero essere sintetizzate con lo slogan ‘dalla fisiologia delle azioni
alla fisiologia dell’attività’ (Bernstein 1967) e sono ispirate alla nascita della teoria dei
controlli (cibernetica). Gli elementi fondamentali si possono enunciare sotto forma di una serie
di affermazioni: (i) E’ impossibile capire il movimento senza studiare la meccanica e le
proprietà degli ‘attuatori’; (ii) Il problema fondamentale nella fisiologia delle azioni è quello di
dominare l’estrema ridondanza dei gradi di libertà intrinseci, riducendone il numero effettivo
in base alle esigenze funzionali di ogni specifica attività, ossia costruendo una ‘sinergia
funzionale’.
•
Teorie dinamiche. Sono ispirate ai concetti ed alla terminologia della dinamica non-lineare e
si basano sull’idea che il sistema motorio è costituito di un insieme di moduli interagenti.
Secondo queste teorie, le proprietà fondamentali del sistema motorio sarebbero l’autoorganizzazione, intesa come proprietà emergente della dinamica interattiva e non come
risultato di un controllo gerarchico; la non-linearità, che permette di ottenere ‘transizioni di
regime’ (per esempio in movimenti ritmici) semplicemente modulando dei parametri di
controllo rispetto a dei valori ‘critici’; la presenza di attrattori (la cui maggiore o minore
stabilità è alla base della variabilità osservata nei comportamenti motori).
•
Teorie ecologiche. Enfatizzano l’importanza dell’ambiente (oltre alla finalizzazione
dell’azione) nella strutturazione di coerenti processi percettivi e motori (Gibson 1966). Esempi
tipici sono atterrare (dopo una fase di volo), afferrare o colpire al volo, in cui la tempistica di
percezione e movimento è ovviamente critica. L’idea è che l’ambiente stesso, nel contesto di
un’azione, fornisce ‘gratis’ delle informazioni specifiche (affordances) che il processo
sensorimotorio deve solo imparare a ‘cogliere’, semplificando enormemente il normale ciclo
percezione-movimento. Negli esempi citati l’informazione critica è il tempo all’impatto, che
può essere stimato riducendo il processo percettivo ad una stima del tasso di variazione del
flusso ottico e che permette l’asservimento dei movimenti finalizzati allo scopo (atterrare,
colpire, ecc.).
Lo sviluppo della robotica e della teoria dei controlli ha fatto sì che ci si ponessero delle domande
relativamente alla natura ed alla strutturazione dei processi di ‘calcolo’ che debbano essere
effettuati per controllare un ‘corpo’, sia esso biologico o artificiale. Sono state quindi sviluppate
teorie del controllo motorio che mirano ad una formalizzazione in termini di
computazionali
processi
interagenti. Queste teorie si potrebbero definire ‘computazionali’ e verranno
passate in rassegna in questo capitolo, mettendo l’accento sul problema di come controllare la
dinamica del corpo e prendendo in considerazione due aspetti particolari: il ruolo delle proprietà
degli attuatori e quello dei modelli o rappresentazioni ‘interne’.
1.2 Natura ecologica del controllo motorio
Si è già detto dell’intimo legame fra percezione e azione. Già gli studi pionieristici di Helmholtz e
von Uexküll avevano suggerito che il cervello utilizzi i comandi motori anche per interpretare le
conseguenze sensoriali del movimento. Questa nozione è tornata in auge nel recente filone di
ricerca orientato alle modalità di apprendimento dei modelli di controllo. Un termine
comunemente utilizzato è quello di corollary discharge (von Holst e Mittelstaedt 1950). In
particolare, ciò implica un paragone effettuato internamente tra un segnale in uscita (la cosiddetta
copia di efferenza) e la corrispondente ri-afferenza sensoriale: la coerenza tra le due
rappresentazioni è la base per la stabilità del mondo senso-motorio.
Questo tipo di circolarità e complementarietà tra comandi motori e segnali sensoriali è
ovviamente incompatibile con un gran numero di schemi interpretativi basati su un’organizzazione
gerarchica dell’informazione e del controllo. Un tipo simile di circolarità è peraltro implicitamente
presente nel concetto Piagetiano di reazione circolare, con cui viene caratterizzato il processo di
apprendimento senso-motorio negli esseri umani (Piaget 1963).
Si può inoltre identificare un ulteriore fenomeno di circolarità nell’interazione
organismo/ambiente all’interfaccia meccanica tra il corpo ed il mondo esterno, in cui le proprietà
meccaniche dei muscoli interagiscono con le proprietà fisiche degli oggetti inanimati. Questo
filone di ricerca si è andato sviluppando dalla scuola Russa, con il lavoro pionieristico di I.P.
Pavlov sulla natura dei riflessi e la successiva rilettura critica effettuata da P.K. Anhokin (1974) e
N. Bernstein (1967). In particolare, si deve a Bernstein il modello del comparatore, secondo cui i
comandi motori sono da soli insufficienti a determinare il movimento ma identificano soltanto un
fattore in un’equazione complessa dove la dinamica dell’ambiente gioca un ruolo determinante.
Questo ha portato, tra le altre cose, a sottolineare la rilevanza della stiffness muscolare e la
formulazione della teoria del punto di equilibrio (Feldman 1966, Feldman & Levin, 1995, Bizzi e
coll. 1992), discussa nelle sezioni successive.
In generale, si può dire che la corollary discharge di Helmholtz, la reazione circolare di
Piaget ed il modello del comparatore di Bernstein sono modi diversi ma complementari di
esprimere la natura ecologica del movimento, ovvero il rapporto di partnership tra i processi
nervosi ed i processi dinamici dell’ambiente.
Infine, non si può ignorare che a questo concetto di ecologia computazionale si possa
ricondurre lo studio recente delle interfacce neurali bi-direzionali (Chiel 1997, DeMarse e coll.
2001, Reger e coll. 2000), con l’aggiunta di un concetto di ergonomia computazionale: con ciò ci
si riferisce al fatto che le proprietà adattative del cervello non possono essere studiate isolatamente
ma solo nel contesto di un’intima interazione con un corpo (naturale o artificiale) ed il mondo
esterno.
1.3 Il contributo della robotica
Nel campo della robotica, i processi computazionali necessari per realizzare un piano motorio sono
stati oggetto di estese ricerche. Come indicato in figura 1, si possono identificare cinque blocchi
principali che corrispondono a diversi processi e che, in linea di principio, potrebbero essere risolti
indipendentemente e in sequenza per poter pilotare il sesto blocco (il carico): (i) formulazione del
piano motorio; (ii) formazione della traiettoria; (iii) risoluzione del problema cinematico inverso;
(iv) risoluzione del problema dinamico inverso; (v) attivazione degli attuatori.
---------------------Figura 1
---------------------La formulazione del piano motorio consiste nella caratterizzazione dettagliata di un gesto
intenzionale mediante la selezione dei punti iniziale e finale, degli eventuali ostacoli, l’ampiezza e
l’orientazione del gesto complessivo, la durata etc, indipendentemente dalla scelta di uno specifico
effettore terminale (end-effector). Dal piano motorio scaturisce una traiettoria x=x(t) dell’effettore
terminale selezionato (processo di formazione della traiettoria), che viene quindi tradotta nella
corrispondente traiettoria q=q(t) nello spazio delle configurazioni del corpo (problema cinematico
inverso). Il passo finale è la determinazione delle forze (o coppie) che i vari attuatori devono
generare per ottenere la traiettoria desiderata (problema dinamico inverso).
2. Formulazione del piano motorio
2.1 Invarianze spazio-temporali nei movimenti volontari
Lo studio sperimentale dei movimenti nell’uomo e nei primati ha mostrato che i movimenti
volontari obbediscono a due leggi psico-fisiche:
1. Legge di Hick-Hyman: in un task basato su scelte multiple, il tempo di reazione dipende
dal logaritmo del numero di scelte (Hyman 1953).
2. Legge di Fitts: la durata di un movimento dipende dal logaritmo dell’accuratezza relativa
ossia dal rapporto fra ampiezza del movimento e dimensione del target (Fitts 1954).
---------------------Figura 2
---------------------Inoltre, l’analisi dei movimenti ha messo in evidenza degli invarianti spazio-temporali o
cinematici: le traiettorie della mano verso un target sono approssimativamente rettilinee,
indipendentemente da direzione e ampiezza del movimento stesso, e hanno un profilo di velocità
‘a campana’ (Morasso 1981; figura 2). Le traiettorie più complesse, come la scrittura corsiva, sono
inoltre relativamente invarianti rispetto all’effettore terminale. Queste osservazioni sono state
interpretate come evidenza dell’esistenza nel sistema nervoso di rappresentazioni interne a
carattere
puramente geometrico-spaziale. Ciò è consistente con la nozione di ‘programma
motorio’ (Keele 1968) ed ha trovato supporto neurofisiologico con l’osservazione (Georgopoulos
e coll. 1986) che nei primati la corteccia motoria primaria codifica la direzione istantanea del
movimento. Si è poi trovato che tale correlazione si verifica anche in altre aree corticali (premotoria, motoria supplementare e parietale) ed inoltre è stato dimostrato che il codice direzionale
(estratto in tempo reale mediante un array impiantato di microelettrodi) permette ad un primate di
effettuare un controllo efficace dei movimenti di un robot (Wessberg e coll. 2000).
Si è cercato di dare una spiegazione computazionale degli invarianti cinematica. Per esempio, è
stato proposto che l’andamento ‘a campana’ del profilo di velocità sia spiegabile con l’ipotesi che
uno degli obiettivi del sistema nervoso sia la massimizzazione della ‘dolcezza’ (smoothness) del
movimento, un requisito ottenibile minimizzando l’integrale nel tempo della norma della terza
derivata della traiettoria – il cosiddetto modello minimum-jerk (Flash e Hogan 1985).
Alternativamente, è stato suggerito che le caratteristiche delle traiettorie siano conseguenze della
meccanica del corpo, senza che sia necessario ipotizzare alcuna ottimizzazione (Gribble e Ostry
1996), oppure che l’ottimizzazione sia ‘globale’, cioè tenga conto della meccanica del corpo e
della dinamica muscolare; ad esempio, è stato proposto che venga minimizzata la variazione del
comando motorio – il modello minimum torque-change (Uno e coll. 1989), oppure l’incertezza
sulla posizione finale, nell’ipotesi che nei comandi motori la varianza del rumore sia proporzionale
al valore medio (Harris e Wolpert 1998).
2.2 Traiettorie complesse come composizione di traiettorie elementari
Un’altra questione fondamentale è se traiettorie complesse possano essere interpretate come
combinazioni di traiettorie elementari. L’osservazione della struttura temporale della scrittura
corsiva (Morasso e Mussa Ivaldi 1982), quella di movimenti liberi e pseudo-casuali dell’arto
superiore nello spazio tri-dimensionale (Morasso 1983) come pure quella di apertura e chiusura
della laringe in sequenze di fonemi a velocità differenti hanno suggerito che in effetti un piano
motorio complesso venga trattato dal sistema nervoso come una sequenza di movimenti elementari
o ‘stroke’ si(t) , identificati da opportuni target intermedi o via-point e raccordati tra loro
mediante sovrapposizione temporale:
x(t ) = ∑ si (t − t i )
i
(1)
3. Problema cinematico inverso
Per movimenti nello spazio tri-dimensionale, x(t ) è (in generale) un vettore 6-dimensionale (tre
dimensioni specificano la posizione, le altre tre l’orientazione dell’effettore terminale) e in accordo
con la nozione di programma motorio è indipendente dallo specifico effettore terminale. Il passo
successivo è la selezione dell’effettore, a cui corrisponde una specifica relazione geometrica,
x=x(q), detta trasformazione cinematica diretta; q è la configurazione del corpo che, se questo è
approssimabile come un insieme di corpi rigidi articolati, è definita da un insieme di angoli ai
giunti.
Il passo successivo è tradurre la traiettoria x(t) dell’effettore terminale nella corrispondente
traiettoria q(t) nello spazio delle configurazioni. Ciò corrisponde a invertire la trasformazione
cinematica diretta, per cui l’operazione è detta problema cinematico inverso. Il problema si può
formulare in termini differenziali, ossia considerando movimenti di ampiezza infinitesimale. Sia
J (q ) la matrice Jacobiana della trasformazione x = x(q) ; si può scrivere la relazione seguente:
x& = J (q) q&
(2)
Se x e q hanno la stessa dimensione ed inoltre la configurazione q non è singolare, allora il
problema cinematico inverso ha una sola soluzione calcolabile semplicemente come segue:
q& = J (q ) −1 x&
.
Se invece la dimensione n di x ha è maggiore della dimensione p di q, allora la
trasformazione è detta ridondante ed il problema dell’inversione cinematica ha un numero infinito
di soluzioni.
Dalla robotica si sa che la soluzione a minima norma, ossia quella che minimizza la norma del
vettore velocità angolare, utilizza la matrice pseudo-inversa di Moore-Penrose:
q& = J (q )T [ J (q ) J (q )T ]−1 x&
(3)
Tuttavia si tratta di una soluzione numericamente poco robusta in vicinanza delle singolarità
cinematiche ed inoltre è caratterizzata da una condizione di non integrabilità, nel senso che se si
pilota il robot con questo algoritmo in relazione ad una traiettoria chiusa nello spazio ripetuta più
volte (come nella rotazione di una chiave inglese), si ottiene una traiettoria nello spazio dei giunti
che non è chiusa e tende a spostarsi progressivamente verso le escursioni angolari limite.
Non è chiaro come il sistema nervoso risolva il problema cinematico inverso. La questione è stata
affrontata da molti ricercatori e sono stati proposti diversi ‘criteri di ottimalità’ biologici.
Un’alternativa computazionale ‘ecologica’ è il ‘paradigma del moto passivo’ (Mussa Ivaldi e coll.
1988). Il punto di partenza è una conseguenza della geometria delle catene cinematiche, ovvero il
fatto che la coppia articolare necessaria per equilibrare una forza esterna, applicata all’effettore
terminale (vedi Figura 3) è data da:
τ = J (q) T Fext
(4)
Questa relazione può essere considerata una ‘affordance’ in senso Gibsoniano e se ne può dedurre
un meccanismo computazionale in cui un modello interno del braccio viene assoggettato a forze
virtuali generate dal meccanismo di generazione di traiettorie precedentemente considerato. Il
rilassamento del modello a tali stimoli interni (in questo senso si parla di ‘paradigma di moto
passivo’) fornisce una soluzione al problema inverso senza dover invertire alcunché. Inoltre il
procedimento tollera la ridondanza, sfugge alle singolarità cinematiche e soddisfa ai requisiti di
integrabilità.
---------------------Figura 3
----------------------
4. Controllo della dinamica
4.1 Coppie di interazione dinamica
Le equazioni del moto di una catena cinematica hanno la seguente struttura:
I (q) ⋅ q&& + C (q, q& )q& + G (q) + J (q) T Fext = τ
(5)
&& identifica le forze inerziali,
dove q= q (t ) è la traiettoria nello spazio dei giunti, I (q )q
proporzionali all’accelerazione, C (q, q& )q&
le forze centripete e di Coriolis, che dipendono in
modo quadratico dalla velocità, G (q ) le forze gravitazionali, che dipendono soltanto dalla
configurazione, e Fext i disturbi/carichi esterni applicati all’effettore terminale. Questa equazione
è fortemente non lineare ed agisce in effetti come una sorta di disturbo interno che tende a
‘perturbare’ le traiettorie pianificate. Il termine inerziale è predominante durante le parti iniziale e
terminale dei movimenti, mentre il termine di Coriolis ha più peso nella parte intermedia, quando
la velocità è massima. La Figura 4 mostra una simulazione relativa ad un braccio planare con 2
gradi di libertà: sono state generate 8 diverse traiettorie con lo stesso punto di partenza; per ognuna
di queste è stata applicata l’Eq. 5 e la coppia generata dagli attuatori è stata tradotta in una forza
equivalente, applicata all’effettore terminale, mediante l’Eq. 4.
---------------------Figura 4
-------------------------
La Figura 4 mostra che i pattern di forza (e quindi di coppia) sono assai variabili in relazione alla
direzione del movimento. In particolare, se si decompone la forza in una componente longitudinale
(orientata cioè come il movimento desiderato) ed una componente trasversale, la prima
componente si può interpretare come la comune resistenza inerziale, che viene incontrata per
esempio nella manipolazione di un grave, mentre la componente trasversale si può interpretare
come un disturbo che, se non è adeguatamente compensato, tende a deviare lateralmente la
traiettoria pianificata. Come si può vedere dalla figura, anche nel caso semplice di un braccio
planare l’ordine di grandezza di tali forze di disturbo è paragonabile a quello delle componenti
inerziali principali. Inoltre, si può anche notare che le parti iniziale e finale del movimento
tendono ad essere più affette da tale disturbo di quelle intermedie.
Si noti che le forze di interazione esistono soltanto in movimenti coordinati con numerosi gradi di
libertà: se i movimenti sono decomposti in sequenze di rotazione di singoli giunti, tali forze
spariscono (sia pure alle spese della funzionalità e fluidità dei movimenti): quest’effetto può
spiegare perché in numerose patologie neuro-motorie la segmentazione dei movimenti si manifesta
come meccanismo di adattamento ad un deficit di controllo (diminuisce la fluidità ma elimina le
forze di interazione).
4.2 Proprietà visco-elastiche dei muscoli e impedenza meccanica
Una delle intuizioni fondamentali di Bernstein (1967) è stata l’osservazione che è impossibile
capire il movimento senza tenere conto della
meccanica e delle proprietà peculiari degli
‘attuatori’. Per comprendere le peculiarità dei muscoli intesi come dispositivi di attuazione, è utile
confrontarli con i motori in corrente continua, un tipo di attuatore largamente utilizzato in robotica.
Da un punto di vista puramente funzionale, le differenze sono sintetizzate in Figura 5.
---------------------Figura 5
---------------------Come nei motori, nelle fibre muscolari la forza generata dipende dalla velocità; queste ultime
differiscono dai primi per il fatto che la forza dipende anche dalla lunghezza (Hill 1938; Rack and
Westbury 1969).
Ciò implica che le fibre muscolari sono capaci di immagazzinare energia
elastica, ossia sono assimilabili a ‘molle’.
Se poi si tiene conto che i muscoli combinano molte fibre muscolari con orientazione e
caratteristiche meccaniche differenti; che tendini e tessuto fibroso contribuiscono al
comportamento meccanico complessivo; ed infine che i punti di origine e di inserzione e il
percorso delle fibre sono geometricamente complessi, ne consegue che i contributi dei singoli
muscoli al movimento del corpo si possono descrivere con una relazione fra forza, lunghezza e
velocità estremamente complessa. Infine, i muscoli sono parte di circuiterie riflesse spinali (ad
esempio, il riflesso di stiramento), per cui il livello di eccitazione dipende esso pure da
allungamento e velocità di allungamento. Tali riflessi sono modulabili volontariamente, per cui è
possibile variare il comportamento meccanico di un gruppo muscolare da prevalentemente elastico
a prevalentemente viscoso (Winters 1995, Lin e Rymer 1998).
In generale, è possibile esprimere il comportamento meccanico del sistema costituito dal muscolo
e dai riflessi spinali con un’impedenza meccanica, cioè un operatore che specifica la forza generata
in funzione dello stato meccanico e del comando discendente:
f = f (l , l&, u )
(6)
dove f è la forza esercitata dal muscolo, l è la lunghezza, l& è la velocità di accorciamento e u è
l’insieme dei comandi neurali discendenti. Perché un sistema meccanico si possa considerare una
‘molla’, occorre che possa immagazzinare energia elastica, ossia che esista la quantità:
E (l ) = −∫ f (l , l&, u ) ⋅ dl
(7)
Affinché questo avvenga, è sufficiente che la Eq. 6 sia integrabile.
E’ poi sempre possibile linearizzare la Eq. 6 nell’intorno di un determinato punto di lavoro,
definito dalla terna (l o , l&o , u o ) , per cui si ottiene:
∂f
∂f
∂f
f = f (lo , l&o , u o ) + δl + δl& + δu
&
∂l
∂u
∂l
{
{
{
k
b
(8)
c
dove le quantità k, b e c sono rispettivamente la rigidità (stiffness), la viscosità e il guadagno
neurale. Da questa definizione risulta evidente che stiffness e viscosità sono proprietà ‘puntuali’
dell’impedenza meccanica, ossia dipendono dal punto di lavoro.
Volendo interpretare il comportamento dell’intero corpo in risposta alle perturbazioni, occorre
estendere la nozione di ‘molla’ al caso n-dimensionale (Hogan 1985). Si consideri un campo di
forze, definito dalla relazione F = F ( X , X& ) , ossia una forza F, che dipende dalla posizione X ed
eventualmente dalla velocità, X& . Il campo di forze definisce una ‘molla’ se è conservativo. In
particolare, linearizzando nell’intorno di un punto Xo , si può scrivere F = − K ⋅ ( X − X o ) − B ⋅ X&
e per avere la conservatività del campo occorre che la matrice K
simmetrica, oltre ad essere
definita positiva.
(matrice di stiffness) sia
In queste condizioni la matrice è anche
diagonalizzabile ed ha autovalori positivi; di conseguenza può essere visualizzata come un ellisse:
gli assi principali corrispondono agli autovettori (direzioni privilegiate in cui i vettori forza e
spostamento sono collineari), e le lunghezze dei semiassi sono proporzionali agli autovalori (che
dimensionalmente sono coefficienti di stiffness). Si consideri ad esempio l’arto superiore. Se la
mano è nella posizione Xo , e le viene somministrata una perturbazione dX, il braccio risponde con
una forza di richiamo F, che in generale non avrà la stessa direzione della perturbazione. E’
possibile stimare numericamente i coefficienti della matrice K e verificare se è simmetrica e
definita positiva. Se questo è il caso, si può concludere che il braccio si comporta come un sistema
conservativo (cioè, una molla) rispetto alle perturbazioni della mano, e l’ellisse di stiffness
visualizza la struttura geometrica di K (Figura 6).
---------------------Figura 6
---------------------Come si vede dalla figura, l’orientazione dell’ellisse di stiffness appare essere caratterizzata da un
andamento polare, con l’asse maggiore (ossia la direzione in cui la mano è più rigida) allineato
lungo la congiungente spalla-mano. La dimensione di tali ellissi può essere facilmente controllata
volontariamente modulando il livello di coattivazione dei muscoli. Al contrario, l’orientazione non
può essere facilmente modificata, con l’eccezione di movimenti altamente specializzati (Burdet e
coll. 2001).
4.3 Conseguenze della visco-elasticità muscolare
Le implicazioni della visco-elasticità del sistema muscolare sulle teorie del controllo motorio,
apprezzate soltanto nei tardi anni ’70, sono ancora relativamente controverse.
Innanzitutto, la visco-elasticità muscolare è alla base di una delle funzionalità più sofisticate del
controllo motorio biologico, ossia la capacità di manipolare oggetti. E’ stato dimostrato in campo
robotico che, affinché la manipolazione sia stabile, è necessario che il robot appaia all’interfaccia
con l’ambiente esterno come un dispositivo ‘passivo’, ossia un dissipatore netto di energia. Se il
comportamento all’interfaccia è di tipo conservativo, come avviene nel caso biologico, questa
condizione è automaticamente verificata; per contro, lo stesso risultato è molto più difficile da
ottenere in robotica se non emulando con complessi meccanismi di controllo le caratteristiche
degli attuatori muscolari.
Un’altra conseguenza della visco-elasticità muscolare, comprendendo le componenti riflesse
spinali, è di implementare un sistema di controllo a feedback implicito (e istantaneo), che tende a
contrastare l’azione di disturbi e carichi esterni e interni, come l’azione della gravità e la intrinseca
dinamica delle masse corporee. La questione principale è la rilevanza quantitativa e funzionale di
questo effetto: per alcuni ricercatori, la stiffness muscolare è tutto ciò che è necessario, senza
bisogno di modelli dinamici interni, per la compensazione di disturbi interni ed esterni. E’ stato
suggerito (Feldman 1966) che esso costituisca essenzialmente un controllore di posizione così che,
per generare un movimento, al sistema nervoso sarebbe sufficiente specificare una traiettoria
desiderata o ‘virtuale’, che costituirebbe il ‘punto di lavoro’ mobile di muscoli e riflessi. Questa
ipotesi, nota come Ipotesi di Punto di Equilibrio (Equilibrium-Point Hypothesis), nelle sue varie
formulazioni (Feldman 1966, Bizzi e coll. 1992, Feldman & Levin 1995) ha avuto grande
influenza fino a metà degli anni ’90. A parte la sua eleganza e la attraente natura ecologica, la
teoria sarebbe plausibile soltanto se i valori empirici della stiffness muscolare, all’equilibrio e
durante il movimento, fossero sufficientemente elevati rispetto alla tipica dinamica del
movimento. Molti sono stati i tentativi di stimare l’entità della stiffness, sia in condizioni statiche
(Mussa Ivaldi e coll. 1985, Tsuji e coll. 1995) che dinamiche (Bennett e coll. 1992, Won e Hogan
1995, Gomi e Kawato 1996), ma, come dimostrato da paralleli studi modellistici (Gribble e coll.
1998), l’interpretazione dei risultati nasconde sottigliezze che non consentono una conclusione
risolutiva.
In ogni caso, quale che sia la risposta, molti studi hanno via via dimostrato che, in parallelo al
controllo della stiffness, il sistema nervoso ha a disposizione altri meccanismi, che sono
probabilmente più efficienti per i task dinamici più complessi. Ad esempio, è probabile che
l’importanza relativa della stiffness sia maggiore in movimenti di minima ampiezza, come la
scrittura corsiva, che coinvolgono masse relativamente piccole, che nel caso di ampi gesti sportivi,
che possono coinvolgere masse elevate, alte velocità ed un elevato livello di accuratezza.
In generale, a parte la stiffness, il problema dinamico inverso può essere risolto mediante
meccanismi anticipativi (feedforward) o correttivi (feedback); vedi Figura 7.
---------------------Figura 7
---------------------4.4 Meccanismi di controllo feedforward
Uno schema di controllo feedforward (Figura 7, in alto) è basato sulla computazione preprogrammata (e quindi anticipativa) delle forze che saranno necessarie al sistema nell’esecuzione
di un determinato piano motorio, senza l’utilizzo di informazioni sensoriali se non per la
formulazione dello stato desiderato. Ciò corrisponde a risolvere l’equazione del moto (Eq. 5)
rispetto alle coppie generate dagli attuatori e per fare questo è necessario che il sistema nervoso
mantenga una rappresentazione interna o ‘modello’ inverso della fisica del corpo e degli attuatori.
Un tale meccanismo di controllo è veloce e non corre il rischio dell’instabilità, ma ha un ovvio
inconveniente: la sensibilità a disturbi imprevisti, a modificazioni del corpo (per esempio la
presenza di utensili) e/o degli attuatori (per esempio, l’affaticamento). Ciò suggerisce che un
controllore feedforward debba necessariamente avere caratteristiche adattative ed è stato proposto
(Kawato e Gomi 1992) che una plausibile localizzazione di questi meccanismi adattativi sia la
neocorteccia cerebellare. Gli stessi autori hanno inoltre proposto un modello di adattamento del
modello interno che implementa il controllo feedforward. Il modello, denominato feedback error
learning (Figura 8) è basato sulla cooperazione tra due meccanismi di controllo (uno a feedback,
che opera nella fase iniziale dell’addestramento, ed uno a feedforward, che emerge nella fase
successiva) e su una strategia di auto-apprendimento. In questo modello, l’errore di retroazione nel
controllore a feedback (la discrepanza fra traiettoria desiderata e quella attuale) è utilizzato come
segnale di apprendimento di un modello feedforward, che agisce in parallelo e prende
gradualmente il posto del controllore a feedback mano a mano che l’errore di retroazione
diminuisce, acquisendo quindi un modello interno inverso della dinamica del corpo. Occorre
sottolineare che un tale schema di apprendimento non converge del caso di sistemi o carichi
instabili, ad esempio nella stabilizzazione della stazione eretta (si vedano le sezioni seguenti).
---------------------Figura 8
---------------------Diversi studi hanno mostrato che il sistema nervoso utilizza rappresentazioni interne per anticipare
le conseguenze delle forze di interazione dinamica. In particolare, Lackner e Dizio (1994) hanno
mostrato che il sistema nervoso è in grado di prevedere le forze centripete e di Coriolis; evidenze
sperimentali dello stesso fenomeno, a livello delle attivazioni dei muscoli di spalla e gomito, sono
state ottenute da Gribble e Ostry (1999). Analogamente, Flanagan e Wing (1997) hanno mostrato
che nella prensione la forza di chiusura viene programmata in anticipo sulla forza di trazione; più
di recente, Flanagan e Lolley (2001) hano mostrato che durante il trascinamento di un oggetto la
forza incidente, che controlla l’attrito, viene programmata con grande precisione e in anticipo in
modo da seguire l’andamento della forza tangenziale. Questi studi nel complesso suggeriscono che
il sistema nervoso ha capacità sofisticate di controllo anticipativo, per cui sono necessari modelli
interni accurati della dinamica del corpo e delle interazioni con l’ambiente.
4.5 Meccanismi di controllo a feedback
Un ovvio inconveniente della modalità di controllo feedforward è che non è in grado di rispondere
a perturbazioni inaspettate. Se queste possono essere misurate, o se più in generale sono
disponibili informazioni sensoriali sull’evoluzione del movimento, queste possono essere utilizzate
per effettuare correzioni ‘al volo’ del movimento stesso, in modo che questo segua il piano
motorio desiderato (vedi Figura 7, in mezzo). Ciò corrisponde alla modalità di controllo a
feedback. Il problema è che l’informazione sensoriale è disponibile con un ritardo non trascurabile
(a parte il feedback implicito fornito dalla stiffness intrinseca dei muscoli) e questo pone seri
problemi per la stabilità del controllo.
Per fissare le idee, consideriamo un esempio molto semplice, ma con parametri abbastanza simili a
diversi sottosistemi motori biologici: un sistema massa-molla, con una frequenza naturale
f n = ω n / 2π =1 Hz ed un fattore di smorzamento ξ=0.5, sotto l’azione di un controllore
proporzionale/derivativo (PD). Supponiamo che il rapporto tra i due guadagni (proporzionale e
derivativo) sia 10:1 e determiniamo il guadagno complessivo di anello in modo che la precisione
asintotica in anello chiuso nella risposta al gradino sia il 90%. Si tratta di un esercizio elementare
di teoria dei controlli lineari. In particolare, il diagramma di Bode del sistema è quello indicato in
Figura 9 e ci mostra che il margine di fase del controllo in catena chiusa è ϕ = 84o ad una
pulsazione ω =36 rad/s. In queste condizioni il controllo in catena chiusa è stabile ed opera
perfettamente. Tuttavia, se supponiamo che ci sia un ritardo T nell’anello di controllo, possiamo
calcolare cosa cambia della stabilità del controllo. Infatti, il ritardo temporale introduce uno
sfasamento negativo, linearmente dipendente dalla frequenza: ∆ϕ = −ωT . Si può quindi dedurre
il valore limite del ritardo oltre il quale il controllo diventa instabile: nell’esempio tale valore
risulta essere T=40 ms. In applicazioni robotiche non è difficile limitare il ritardo a valori che sono
1 o 2 ordini di grandezza inferiori, ma questo non accade nel caso biologico, in cui i ritardi si
misurano in molte decine di millisecondi. Quindi un controllore PD biologico corre un serio
rischio di essere instabile anche in casi apparentemente semplici e lontani dall’instabilità.
---------------------Figura 9
---------------------4.6 Integrazione senso-motoria e filtro di Kalman
Il problema della instabilità del controllo feedback può essere risolto fornendo al regolatore non
l’informazione sensoriale, che è disponibile in ritardo, ma piuttosto una stima dello stato attuale,
basata su informazioni presenti e passate.
Almeno due sorgenti di informazioni possono essere utilizzate nella stima dello stato (posizione,
velocità) del corpo:
•
le afferenze sensoriali (riafferenze) i comandi motori (copia efferente)
Quest’operazione è un’integrazione senso-motoria che è alla base, per esempio, del concetto di
corollary discharge precedentemente menzionato. Utilizzando il linguaggio della teoria dei
controlli si può ricordare che se la dinamica del corpo è rappresentabile come un sistema dinamico
lineare, con ingresso u, stato x ed uscita y, la soluzione ottima del problema dell’integrazione
senso-motoria è data dal filtro di Kalman:
xˆ i +1 = Axˆ i + Bu i + K i ⋅ [ y i − Cxˆ i ]
(9)
Il filtro definito da questa equazione ‘predice’ lo stato attuale sulla base di informazioni sensoriali
‘passate’ e contiene un modello interno (‘diretto’) del corpo. Il filtro di Kalman ha caratteristiche
di ottimalità dal punto di vista matematico/statistico ma naturalmente la questione è la sua
rilevanza per il modellamento dei meccanismi di integrazione senso-motoria che hanno luogo nel
sistema nervoso. Per verificare questa possibilità, Wolpert e coll. (1995) hanno valutato la
precisione con cui viene stimata la posizione del braccio durante movimenti in assenza di visione,
in cui quindi le uniche informazioni disponibili sono la propriocezione e la copia efferente. Tali
valori empirici sono stati paragonati con quanto predetto da un filtro di Kalman, nell’ipotesi che la
precisione della stima vari con la durata del movimento (Figura 10): in entrambi i casi l’errore
aumenta durante il primo secondo per poi tornare a diminuire e a mantenersi approssimativamente
costante. L’effetto è quindi interpretabile con un’iniziale prevalenza della copia efferente nella
determinazione della stima, che produce una accumulazione dell’errore; in seguito la componente
sensoriale diventa sempre più affidabile e l’errore torna a diminuire.
---------------------Figura 10
---------------------Un osservatore dello stato può essere utilizzato in uno schema di controllo a feedback, ed è in
grado di eliminare le instabilità dovute ai ritardi di propagazione dell’informazione sensoriale
(vedi Figura 7, in basso).
Non ci sono prove dirette ed inequivocabili che il sistema nervoso utilizzi meccanismi a feedback
basati su modelli interni che stimano lo stato presente sulla base di informazione sensoriale
‘passata’, ma ci sono numerose evidenze indirette: per esempio è stato mostrato (Desmurget &
Grafton 2000) che in movimenti di reaching in cui il target viene spostato (target jump), la prima
evidenza di correzione della traiettoria risale a non più di 110 ms dopo lo spostamento, un
intervallo incompatibile con i ritardi sensoriali che sono molto maggiori.
Il modello di controllo a feedback mediante osservatore dello stato ha un’altra proprietà. Se il
guadagno del regolatore è infinito, la parte di regolatore che utilizza la copia efferente equivale a
un controllo feedforward. Quindi lo schema di controllo a feedback basato sull’osservatore dello
stato può essere in effetti interpretato come una combinazione ‘ottima’ di modalità di controllo
feedback e feedforward.
Un’altra classe di studi sperimentali ha in effetti mostrato come nel sistema nervoso convivano
modalità di controllo feedforward e feedback, basate su modelli interni capaci di adattamento. Si
tratta degli studi relativi all’apprendimento della dinamica di campi di forza artificiali, realizzati
mediante interfacce aptiche robotizzate (Shadmehr e Mussa Ivaldi 1994), che hanno suggerito la
compresenza delle due modalità di controllo (Sainburg e coll. 1999, Bhushan e Shadmehr 1999),
sia pure con significative differenze. Si è verificato, per esempio, che hanno diverse velocità di
adattamento: il controllo a feedback tende ad adattarsi più rapidamente del controllo feedforward
(Thoroughman e Shadmehr 1999) in risposta a campi di forza mai prima sperimentati. Ciò
suggerisce che le due modalità siano almeno in parte mediate da aree differenti del sistema
nervoso.
Infine, la coesistenza delle due modalità di controllo, getta nuova luce su una congettura di
Woodworth (1899) secondo cui ‘il movimento è composto da due tipi di componenti: l’impulso
iniziale e il controllo corrente. Il controllo corrente consiste in una sequenza di aggiustamenti più
fini, aggiunti all’impulso iniziale via via che la mano si avvicina al target’.
In effetti, i risultati illustrati in precedenza suggeriscono che almeno nei movimenti di reaching la
fase iniziale è essenzialmente sotto controllo anticipativo; entra quindi in gioco la componente
feedback, che prevale nella fase finale.
5. Disturbi della coordinazione
L’ipotesi che il cervelletto sia dotato di competenze computazionali con riferimento alla ‘fisica’
del corpo (Marr, 1969; Ito, 1984; Kawato e Gomi, 1992; Braitenberg e coll 1997, Kawato 1999) ha
suggerito che la circuiteria cerebellare svolga un ruolo cruciale nel controllo della dinamica. Lo
studio delle sindromi cerebellari sembra quindi essere in grado di fornire importanti suggerimenti
sui meccanismi neurali per il controllo della coordinazione senso-motoria.
L’atassia è il sintomo principale di disfunzione cerebellare. Secondo la classica definizione di
Holmes (1917, 1939), il termine indica una serie di problemi nella pianificazione e nell’esecuzione
dei movimenti, comprendenti: (1) ritardo nell’inizio del movimento, (2) inaccuratezza nel
raggiungimento di un target (dismetria), (3) incapacità di compiere movimenti a forza e/o ritmo
costante (disdiadococinesìa), e (4) difficoltà a coordinare movimenti con più gradi di libertà
(asinergia). Altri sintomi cerebellari sono la diminuita resistenza agli spostamenti passivi
(ipotonìa) ed il tremore cinetico (un tipo di tremore presente soltanto durante i movimenti, che
tende ad aumentare in ampiezza man mano che ci si avvicina al target). Altre patologie hanno
sintomi interpretabili come disturbi della coordinazione; per esempio, l’assenza di propriocezione
(Gordon e coll. 1995), la distonia (Inzelberg e coll. 1995) e la còrea di Huntington (Smith e coll.
2000).
5.1 Disfunzioni della componente anticipativa del controllo
L’analisi di movimenti mono-articolari in pazienti con atassia cerebellare (Brown, e coll. 1990)
rivela profili di velocità asimmetrici, con un aumento della durata della fase di decelerazione. Lo
stesso fenomeno è stato osservato in movimenti a più gradi di libertà (Becker, e coll. 1990, 1991,
Sanguineti e coll. 2003); vedi Figura 11. I sintomi sono molto più evidenti nei movimenti che
coinvolgono molteplici gradi di libertà: incoordinazione di spalla e gomito, curvatura delle
traiettorie della mano e dismetria (Bastian e coll. 1996). Questi autori hanno suggerito che
l’asimmetria del profilo di velocità sia principalmente dovuta ad una scorretta temporizzazione fra
le rotazioni delle diverse articolazioni, perchè le singole articolazioni esibiscono profili di velocità
pressoché normali.
---------------------Figura 11
---------------------Gli stessi autori hanno osservato, inoltre, che nei soggetti sani la coppia articolare totale è
altamente correlata con le coppie di interazione (vedi Eq. 6), mentre in pazienti cerebellari tale
correlazione è assente. Questo risultato può essere interpretato come dovuto a una compensazione
difettosa delle coppie di interazione, le quali si verificano soltanto nei movimenti a più gradi di
libertà.
La decomposizione dei movimenti in segmenti in cui si muove un’articolazione alla volta (Bastian,
e coll. 1996; Topka, e coll. 1998a,b), spesso osservabile nei soggetti cerebellari, è interpretabile
come una strategia per eliminare le coppie di interazione. In effetti, le coppie di interazione
esprimono l’accoppiamento dinamico fra le articolazioni dovuto alla meccanica del braccio, e
disaccoppiare i movimenti dei vari gradi di libertà contribuisce a ridurne gli effetti. D’altra parte,
la neutralizzazione delle coppie di interazione mediante decomposizione del movimento ha l’ovvio
inconveniente di peggiorarne la ‘dolcezza’ globale.
Infine, è stato rilevato (Massaquoi e Hallett 1996, Sanguineti e coll. 2003) che inaccuratezze nei
movimenti, attribuibili alle coppie di interazione dinamica che almeno parzialmente vengono
ignorate, sono osservabili anche in soggetti sani se il movimento è sufficientemente rapido, anche
se la loro ampiezza è molto minore che nei soggetti cerebellari.
In uno studio clinico volto a caratterizzare l’atassia cerebellare in termini di deficit di controllo,
Sanguineti e coll. (2003) hanno rilevato (vedi Figura 11, in basso) che nella fase iniziale del
movimento, presumibilmente controllata in modo feedforward, i soggetti cerebellari evidenziano
un errore direzionale (o ‘di mira’, definito come l’angolo fra la direzione del target e quella della
fase iniziale del movimento) che è significativamente maggiore di quello osservato in soggetti
sani. L’errore di mira inoltre dipende dalla direzione del movimento: la Figura 11 (in basso)
illustra, per ciascun soggetto, la relazione fra l’errore di mira e la direzione del movimento relativa
alla direzione principale dell’ellisse di inerzia: si può vedere che l’errore tende ad annullarsi nella
direzione principale, ed è caratterizzato da deviazioni laterali nelle altre direzioni, consistenti con
le caratteristiche direzionali dell’inerzia.
Il fatto che l’errore sia minimo nella direzione di massima inerzia, in cui il movimento richiede
una maggiore forza, suggerisce, in particolare, che esso non possa essere interpretato come dovuto
a un difetto di forza muscolare ma debba invece essere attribuito ad un controllo anticipativo
difettoso. Per contro, nella loro fase finale gli stessi movimenti non differiscono significativamente
da quelli dei soggetti normali, il che suggerirebbe che almeno nei soggetti cerebellari esaminati la
modalità feedback del controllo sia preservata.
5.2. Disfunzioni della componente feedback del controllo
Una situazione opposta è stata riscontrata in altre patologie che comportano un pesante
coinvolgimento della coordinazione motoria, la còrea di Huntington, la distonia e l’assenza di
propriocezione. In particolare, è stato mostrato (Smith e coll. 2000) che i sintomi iniziali della
còrea di Huntington sono interpretabili come una anormalità nei meccanismi correttivi del
controllo, il cui ruolo è prevalente durante la fase finale del movimento. Per quanto riguarda la
distonia, sono stati rilevati un aumento di durata della fase di decelerazione del movimento
(Inzelberg e coll. 1995), unita a un generale peggioramento della performance in assenza di
visione, che ha suggerito problemi di integrazione senso-motoria.
Siccome la còrea di Huntington produce una degenerazione del nucleo caudato, che fa parte dei
nuclei della base, si potrebbe ipotizzare che la circuiteria relativa al controllo anticipativo sia
probabilmente localizzata nel cervelletto, mentre quella relativa al controllo feedback coinvolga i
nuclei della base ed il loop cortico-talamico.
---------------------Figura 12
---------------------La Figura 12 riporta i risultati di uno studio (Gilman e coll. 1976) in cui sono stati studiati gli
effetti sulla coordinazione dei movimenti dell’arto superiore di due tipi di lesioni: deafferentazione
e decerebellazione1. A parziale conferma di quanto sopra riportato, si può vedere che la
deafferentazione agisce soprattutto sulla fase finale del movimento, mentre la decerebellazione ne
influenza la fase iniziale.
6. Controllo di sistemi instabili
Negli ultimi anni c’è stato un certo interesse per i meccanismi di controllo di sistemi instabili, con
particolare riferimento a due situazioni:
-
Stabilizzazione della stazione eretta (Winter e coll. 1998, Morasso & Schieppati 1999,
Morasso & Sanguineti 2002, Baratto e coll. 2002, Loram e coll. 2001, Loram & Lakie
2002a);
-
Formazione di traiettorie della mano in un campo artificiale di forze di tipo instabile
(Burdet e coll 2001).
In entrambi i casi, l’instabilità è associata con l’esistenza di un potenziale che è massimo
nell’intorno dello stato di riferimento e corrisponde quindi a un campo di forze divergente, che si
oppone all’azione stabilizzante della stiffness muscolare. In generale, tenendo conto di quanto
detto nelle sezioni precedenti, i possibili meccanismi di stabilizzazione di un carico instabile sono i
seguenti:
1. Meccanismo riflesso, potenzialmente mediato dai numerosi feedback sensoriali
disponibili; non è proponibile in questo contesto poiché i ritardi di propagazione
nell’anello di controllo sono tali da peggiorare le condizioni di instabilità piuttosto che
migliorarle.
2. Meccanismo legato alla stiffness: opera senza ritardo e può essere modulato agendo sul
livello di coattivazione, che è applicata uniformemente a tutti i muscoli di un gruppo
funzionale, oppure operando una ri-distribuzione delle attività per adattarsi in modo ottimo
alle peculiarità del compito o carico.
3. Meccanismo di controllo feedforward/feedback basato su modelli interni, che per sua
natura è di tipo integrativo e centrale; si basa su due tipi di modelli interni: a) un modello
per la fusione multi-sensoriale, che possa compensare mediante predizione i ritardi di
trasduzione e propagazione dell’informazione sensoriale; b) un modello per la generazione
dei comandi motori che anticipi le conseguenze destabilizzanti del carico.
1
Con deafferentazione si intende una lesione di (alcune) radici dorsali del midollo spinale. In seguito a tale
lesione il soggetto viene deprivato delle corrispondenti afferente sensoriali, provenienti dai fusi muscolari,
dagli organi tendinei, dai recettori articolari e dai diversi tipi di recettori tattili. Con decerebellazione si
intende l’ablazione (totale o parziale) della corteccia del cervelletto.
In ogni caso, il campo divergente di forze può essere visto come una stiffness negativa ed il tasso
di crescita di questo campo, fuori dal punto di equilibrio, definisce un livello critico di stiffness.
Al di sopra questo livello, la sola stiffness è in grado di stabilizzare il sistema; al di sotto l’effetto
della stiffness muscolare è insufficiente e deve essere complementato da un meccanismo di
controllo di altro tipo, anticipativo o a feedback.
6.1 Stabilizzazione della stazione eretta: evidenza di compensazione anticipativa
Nonostante la sua apparente semplicità, la natura dei meccanismi di controllo che permettono agli
esseri umani di stare in piedi è tuttora oggetto di controversia. Chiaramente giocano un ruolo nel
processo di stabilizzazione e diversi ricercatori hanno sottolineato il ruolo di uno o dell’altro. In
particolare, è stato proposto da Winter e coll. (1998) un modello che attribuisce alla sola stiffness
muscolare la capacità di risolvere il problema. Secondo questa teoria, l’intervento del sistema
nervoso si limita alla selezione di un tono appropriato dei muscoli della caviglia e quindi la
stabilizzazione sarebbe un fenomeno fondamentalmente passivo, senza alcuna componente di tipo
attivo o reattivo.
---------------------Figura 13
---------------------L’equazione di sistema del pendolo invertito umano (Figura 13, a sinistra) è la seguente:
I pθ&& = mgh ⋅ sin (θ ) + τ a
(10)
dove θ è l’angolo di oscillazione posturale, m ed Ip sono la massa ed il momento di inerzia del
corpo, h è la distanza del COM (Centro di Massa) dalla caviglia, g è l’accelerazione di gravità e
τa è la coppia totale della caviglia. Sotto l’ipotesi che gli angoli di oscillazione siano piccoli si può
dedurre dall’ eq. 5 il valore critico della stiffness:
K c = mgh
(11)
Per piccole oscillazioni l’angolo θ varia proporzionalmente agli spostamenti del COM sulla base
di appoggio y ≈ hθ con una banda di frequenza ben al di sotto di 1 Hz e tali oscillazioni sono
associate a spostamenti (u) del centro di pressione (COP) che hanno un’ampiezza leggermente
maggiore ed una larghezza della banda di frequenza significativamente maggiore (fig. 13, a destra;
Baratto e coll. 2002). Si può dimostrare (Morasso & Schieppati 1999) che u è proporzionale alla
coppia articolare della caviglia e che u ed y sono legate dall’equazione seguente:
&y& =
g
( y − u)
h
(12)
In questa equazione y è la variabile controllata e u la variabile di controllo; sinteticamente si può
dire che la differenza COM-COP è proporzionale all’accelerazione del COM. La figura 13
(pannello di destra) mostra la relazione tra le due curve che, pur avendo una banda di frequenza
assai diversa, sono sostanzialmente in fase (il picco della correlazione si verifica per un ritardo
praticamente nullo). Inoltre è stato dimostrato da Gatev e coll. (1999) che l’attività EMG dei
muscoli della caviglia anticipa i pattern COM-COP e quindi non può essere determinata da riflessi
segmentali.
Una simulazione del pendolo invertito umano (Morasso & Sanguineti 2002), attivato da
modelli muscolari realistici e compatibili con i dati sperimentali disponibili (Hunter & Kearney
1982), ha mostrato che il sistema non riesce ad essere stabilizzato dalle sole proprietà muscolari.
Inoltre sono state effettuate delle stime dirette della stiffness articolare della caviglia (Loram &
Lakie 2002b, Morasso e coll 2003) con approcci sperimentali molto diversi. In entrambi i casi i
valori di stiffness stimati sono ben al di sotto del livello critico. La Figura 14 illustra il secondo
approccio, basato su una base basculante motorizzata montata su una piattaforma di forza. Il
motore genera piccole e rapide perturbazioni angolari (1o in circa 150 ms): i relativi spostamenti
del COP (dopo una media sincronizzata con gli stimoli per eliminare l’effetto dell’oscillazione
posturale sottostante) sono proporzionali alla stiffness angolare e possono quindi essere usati per
una stima.
---------------------Figura 14
----------------------
6.2 Movimenti del braccio in un campo di forze divergente: evidenza di una modulazione
della stiffness
Nella manipolazione di oggetti o dispositivi, occorre controllare le forze determinate
dall’interazione con l’ambiente fisico. Studi recenti indicano che questa compensazione è ottenuta
mediante modelli interni della dinamica, cioè rappresentazioni neurali della relazione tra comando
motorio e movimento (Lackner & Dizio 1994, McIntyre
e coll. 1996, Kawato 1999,
Thoroughman & Shadmehr 2000, Wolpert & Kawato 1998). In questi studi, le interazioni con
l’ambiente fisico sono meccanicamente stabili e meccanismi di apprendimento come il feedback
error learning sono in grado di acquisire un modello interno della dinamica inversa che può essere
usato in uno schema di compensazione di tipo feedforward. Tuttavia, in tipici compiti della vita
quotidiana (come mantenere un cacciavite nella fessura di una vite durante l’avvitamento) le forze
di interazione hanno un andamento divergente rispetto al punto di lavoro e quindi corrispondono
ad un compito instabile. Nella maggior parte dei casi, come si è avuto precedentemente occasione
di argomentare al riguardo della stabilizzazione posturale, si possono escludere meccanismi di
stabilizzazione di tipo riflesso lasciando quindi due sole possibilità, che peraltro non sono
mutuamente esclusive ma possono avere un effetto sinergico: 1) una modulazione fine
dell’impedenza meccanica del braccio, 2) un controllo anticipativo basato su modelli interni.
Che il primo tipo di meccanismo possa risolvere il problema della stabilizzazione è stato
dimostrato in uno studio recente (Burdet e coll. 2001) relativamente a movimenti planari del
braccio, vincolato a muoversi sul piano orizzontale mentre impugna un manipolando robotizzato.
Quest’ultimo era stato programmato in modo da generare un campo di forze divergente rispetto ad
una traiettoria nominale (rettilinea in direzione antero/posteriore) ossia perpendicolare rispetto ad
essa e con un’intensità proporzionale allo spostamento laterale: in altre parole, il campo di forze
simula un pendolo invertito. In queste condizioni un soggetto normale è in grado di imparare,
dopo un buon numero di ripetizioni, ad eseguire il movimento desiderato con spostamenti laterali
assai piccoli ma il risultato principale dello studio è che questo adattamento si accompagna ad una
modulazione e rotazione dell’ellisse di stiffness (optimal impedance matching): si passa da una
orientazione polare (rispetto alla spalla) ad una orientazione perpendicolare rispetto alla traiettoria,
che minimizza gli scostamenti da quest’ultima. Questa è evidentemente una strategia assai più
complicata della semplice coattivazione di tutti i muscoli, che aumenterebbe la dimensione
dell’ellisse di stiffness senza alterarne l’orientazione e che quindi risulterebbe meno precisa e più
dispendiosa metabolicamente.
Tuttavia rimane da dimostrare se la strategia dell’optimal impedance matching sia effettivamente
un approccio risolutivo di tipo generale o sia piuttosto un meccanismo particolare principalmente
finalizzato all’apprendimento di gesti specializzati per specifichi contesti dinamici. Questo
problema è stato affrontato in uno studio pilota (Morasso e coll. 2002) in cui un pendolo invertito
fisico (non simulato con un campo di forza programmato) è afferrato dal soggetto a diverse
altezze. Il compito è semplicemente quello di mantenere il pendolo in equilibrio e le modalità di
stabilizzazione sono state quantificate misurando gli angoli di oscillazione del pendolo e l’attività
elettromiografica di diversi muscoli del braccio. In questa situazione sperimentale è possibile
dimostrare che il valore critico di stiffness della mano per la stabilizzazione del pendolo di massa
m e di altezza h dipende dal punto di afferramento (distanza d) secondo la relazione seguente:
Kc >
mgh
d2
(13)
Durante gli esperimenti sono stati mantenuti costanti i valori di m e di h, mentre si è variato il
valore di d chiedendo al soggetto di afferrare il pendolo in diverse posizioni. Pertanto è possibile
discriminare due possibili regimi di controllo a seconda che, per una data posizione di
afferramento, il valore critico sia superiore o inferiore rispetto ai valori fisiologici della stiffness
della mano (Tsuji e coll. 1995). Nel primo caso, che è certamente fisicamente più impegnativo, il
sistema non ha altra scelta che puntare su un controllo anticipativo, per complementare le carenze
dovute ad una stiffness insufficiente. Puntualmente i dati confermano tale considerazione,
mostrando un’attivazione muscolare senza evidenza di coattivazione e sincronizzata con le
oscillazioni del pendolo. Tuttavia un pattern di controllo del tutto simile è stato riscontrato anche
nel caso che la distanza d sia sufficientemente grande da far scendere il valore critico di stiffness al
di sotto dei valori fisiologicamente raggiungibili. Quindi la modulazione della stiffness, al
contrario di quanto trovato da Burdet e coll. (2001), non sembra essere in questo caso il
meccanismo principale di stabilizzazione.
6.3 Possibili criteri di scelta tra modulazione della stiffness e compensazione anticipativa
L’evidenza sperimentale presentata nelle due precedenti sezioni è in una certa misura
contraddittoria. In un caso, controllo posturale, sembra appurato che il livello fisiologico della
stiffness articolare della caviglia sia insufficiente a stabilizzare il corpo eretto e quindi l’unica
soluzione possibile è l’approntamento di modelli interni per un controllo anticipativo. Negli altri
due casi, che riguardano l’arto superiore e che implicano valori critici di stiffness compatibili con
le caratteristiche viscoelastiche dei muscoli, la soluzione adottata dal cervello sembra dipendere
dal compito: a) modulazione della stiffness nel caso di movimenti in un campo di forze artificiale
divergente, b) compensazione anticipativa nel caso di stabilizzazione manuale di un pendolo
invertito. Da cosa può dipendere tale differenza?
Consideriamo, in generale, la dinamica della ‘caduta’ che sottintende a tutti i paradigmi
considerati. L’eq. 11 si riferisce specificamente al caso della postura eretta ma, con piccole
variazioni, si può applicare a tutti i carichi instabili in cui si possa evidenziare un punto di
equilibrio instabile ed un capo di forze divergente: &x& = αx − u , dove α è parametro (positivo) che
dipende dalla struttura del carico instabile ed u è la variabile di controllo. Se consideriamo la
corrispondente funzione di trasferimento,
troviamo che ci sono due poli, entrambi reali:
p = ± α . Quello positivo è la sorgente di instabilità e, in assenza di azioni correttive, determina
una “caduta” ad andamento esponenziale a partire dallo stato di equilibrio ( x = 0 ): la costante di
tempo meccanica, caratteristica della caduta, è T = 1 / α . Riprendiamo in esame i tre casi
considerati sotto questo punto di vista:
-
Nel caso della postura eretta α = g / h e per un valore tipico h = 1 m si ha T = 320 ms ;
-
Nel caso del pendolo invertito stabilizzato manualmente (altezza del pendolo h = 1.8 m)
vale ancora α = g / h e pertanto T = 430 ms ;
-
Nel caso dei movimenti del braccio nel campo di forza artificiale α = K field / M
dove K field è la costante elastica del campo e M è la massa apparente del braccio nella
direzione del campo: negli esperimenti considerati se ne deduce che la costante di tempo è
T ≈ 70 ms .
Si può pertanto osservare che nei due casi in cui c’è evidenza di controllo anticipativo la costante
di tempo meccanica è assai maggiore che nel caso in cui la strategia di controllo adottata è la
modulazione della stiffness. Questo risultato può allora essere spiegato considerando che la
compensazione anticipativa deve avere abbastanza tempo per recuperare i ritardi intrinseci delle
riafferenze sensoriali (che sono dell’ordine di 100 ms) al fine di generare comandi anticipativi
funzionalmente efficaci. I successivi episodi di caduta incipiente caratteristici dell’oscillazione
posturale sono statisticamente indipendenti, perché la direzione di caduta è casuale ed
imprevedibile, e quindi il processo di previsione deve essere riazzerato dopo ogni episodio.
Pertanto, la compensazione anticipativa in compiti instabili può avere successo a condizione che
l’orizzonte temporale critico, prima cioè di una caduta catastrofica, sia significativamente
maggiore di 100 ms. In effetti, se consideriamo una varietà di compiti di stabilizzazione, come
camminare sui trampoli o su un filo teso, bilanciare un bastone sulla mano ecc., è facile
riconoscere che lo scopo di normali manovre di miglioramento della stabilità, come allargare le
braccia o tenere dei lunghi bilancieri, è proprio quello di aumentare il “tempo di caduta” naturale,
dando perciò più tempo al modello interno di generare appropriati aggiustamenti stabilizzatori.
Riferimenti bibliografici
Baratto L, Morasso P, Re C, Spada G (2002) A new look at posturographic analysis in the clinical
context, Motor Control, 6, 248-273.
Bastian AJ, Martin TA, Keating JG, Thach WT (1996) Cerebellar Ataxia: abnormal control of
interaction torques across multiple joints. Journal. of Neurophysiology, 76, 492-509.
Becker WJ, Kunesch E, Freund HJ (1990) Co-ordination of a multi-joint movement in normal humans
and in patients with cerebellar dysfunction. Canadian Journal of Neurological Sciences, 17, 264274.
Becker WJ, Morrice BL, Clark AW, Lee RG (1991) Multi-joint reaching movements and eye-hand
tracking in cerebellar incoordination: investigation of a patient with complete loss of Purkinje
cells. Canadian Journal of Neurological Sciences, 18, 476-87.
Bennett DJ, Hollerbach JM, Xu Y, Hunter IW (1992) Time-varying stiffness of human elbow joint
during cyclic voluntary movement. Experimental Brain Research 88, 433-42.
Bernstein NA (1967) The coordination and regulation of movement. Pergamon Press, New York.
Bhushan N, Shadmehr R (1999) Computational nature of human adaptive control during learning of
reaching movements in force fields. Biological Cybernetics, 81, 39-60.
Bizzi E, Hogan N, Mussa Ivaldi FA, Giszter SF (1992) Does the nervous system use equilibrium-point
control to guide single and multiple movements? Behavioral and Brain Sciences, 15, 603-613.
Braitenberg V, Heck D, Sultan F (1997) The detection and generation of sequences as a key to
cerebellar function: experiments and theory. Behavioral and Brain Sciences 20, 229-245.
Brown SH, Hefter H, Mertens M, Freund HJ (1990) Disturbances in human arm trajectory due to mild
cerebellar dysfunction. Journal of Neurology, Neurosurgery and Psychiatry, 53, 306-313.
Burdet E, Osu R, Franklin DW, Milner TE, Kawato M (2001) The central nervous system stabilizes
unstable dynamics by learning optimal impedance. Nature, 414, 446-449.
Chiel HJ, Beer RD (1997) The brain has a body: adaptive behavior emerges from interactions of
nervous system, body and environment. Trends in Neuroscience, 20, 553-557.
DeMarse TB, Wagenaar, DA, Blau AW, Potter SM (2001) The Neurally Controlled Animat:
Biological Brains Acting with Simulated Bodies, Autonomous Robots, 11, 305-310.
Descartes R (1969) Il mondo. L’uomo. Trad. di M. Garin, Laterza, Bari.
Desmurget M, Grafton S (2000) Forward modeling allows feedback control for fast reaching
movements. Trends in Cognitive Sciences, 4, 423-431.
Feldman AG (1966) Functional tuning of the nervous system with control of movement or
maintenance of a steady posture: 2. Controllable parameters of the muscle. Biophysics, 11, 565578.
Feldman AG, Levin MF (1995) The origin and use of positional frames of references in motor control.
Behavioral and Brain Sciences, 18, 723-745.
Fitts PM (1954) The information capacity of the human motor system in controlling the amplitude of
movement. Journal of. Experimental Pshychology, 47, 381-391.
Flanagan JR, Wing AM (1997) The role of internal models in motion planning and control: evidence
from
grip
force
adjustments
during
movements
of
hand-held
loads.
Journal of Neuroscience, 17, 1519-1528.
Flanagan JR, Lolley S (2001) The inertial anisotropy of the arm is accurately predicted during
movement planning. J. Neuroscience, 21(4), 1361-1369.
Flash, T. and N. Hogan, N. (1985) The coordination of arm movements: an experimentally confirmed
mathematical model. Journal of Neuroscience, 7, 1688-1703.
Gatev P, Thomas S, Kepple T, Hallet M (1999) Feedforward ankle strategy of balance during quiet
stance in adults. Journal of Physiology, 514, 915-928.
Gibson JJ (1966) The senses considered as perceptual systems. Houghton Mifflin, Boston.
Gilman S, Carr D, Hollenberg J (1976) Kinematic effects of deafferentation and cerebellar ablation.
Brain, 99, 311-330.
Georgopoulos A, Schwartz A, Kettner R. (1986) Neuronal population coding of a movement direction.
Science, 233, 1416-1419.
Gomi H, Kawato M (1996) Equilibrium-point control hypothesis examined by measured arm stiffness
during multijoint movement. Science 272, 117-120.
Gordon J, Ghilardi MF, Ghez C (1995) Impairments of reaching movements in patients without
proprioception. I. Spatial errors. Journal of Neurophysiology, 73, 347-360.
Gribble PL, Ostry DJ (1996) Origins of the power law relation between movement velocity and
curvature: modeling the effects of muscle mechanics and limb dynamics. Journal of
Neurophysiology, 76, 2853-2860.
Gribble PL, Ostry DJ, Sanguineti V, Laboissiere R (1998) Are complex control signals required for
human arm movement? J Neurophysiology, 79, 1409-1424.
Gribble PL, Ostry, DJ (1999) Compensation for interaction torques during single and multijoint limb
movement. Journal of Neurophysiology, 82, 2310-2326.
Grillner S (1981) Control of locomotion in bipeds, tetrapods, and fish. In: Handbook of physiology:
the nervous system. Vol. 2. Motor Control. (Brooks VB editor), Williams & Wilkins, Baltimore,
1179-1236.
Harris CM, Wolpert DM (1998) Signal-dependent noise determines motor planning. Nature, 394, 780784.
Hill AV (1938) The heat of shortening and the dynamic constants of muscle. Proceedings of the Royal
Society of London, B126, 136-195.
Hogan N (1985) The mechanics of multi-joint posture and movement control. Biological Cybernetics,
52, 315-331.
Holmes G (1917) The symptoms of acute cerebellar injuries due to gunshot injuries. Brain, 40, 461535.
Holmes G (1939) The cerebellum of man. (The Hughlings Jackson Memorial Lecture.) Brain, 62, 130.
Jackson JH (1873) On the anatomical and physiological localization of movements in the brain. The
Lancet, ristampato in Selected writings of John Hughlings Jackson (1958) J. Taylor editor, Staple
Press, London.
Holst E, von, Mittelstaedt H (1950) Das Reafferenzprinzip. Wechselwirkungen zwischen
Zentralnervensystem und Peripherie. Natur-wissenschaften, 37, 464-476.
Hunter IW, Kearney RE (1982) Dynamics of human ankle stiffness: variation with mean ankle torque.
Journal of Biomechanics, 15, 747-752.
Hyman R (1953) Stimulus information as a determinant of reaction time. Journal of Experimental
Psychology, 45, 188-196.
Inzelberg R, Flash T, Schechtman E, Korczyn AD (1995) Kinematic properties of upper limb
trajectories in idiopathic torsion dystonia. Journal of Neurology, Neurosurgery, Psychology, 58,
312-319.
Ito, M. (1984) The cerebellum and neural control. Raven Press, New York.
Kawato M, Gomi, H (1992) A computational model of four regions of the cerebellum based on
feedback error learning. Biological Cybernetics, 69, 95-103.
Kawato M (1999) Internal models for motor control and trajectory planning. Current Opinions in
Neurobiology, 9, 718-727.
Keele S (1968) Movement control in skilled motor performance. Psychological Bullettin, 70, 387:403.
Krakauer JW, Ghilardi MF, Ghez, C (1999) Independent learning of internal models for kinematic and
dynamic control of reaching. Nature Neuroscience, 2, 1026-1031.
Lackner JR, Dizio P (1994) Rapid adaptation to Coriolis force perturbations of arm trajectory. Journal
of Neurophysiology, 72, 299-313.
Lin DC, Rymer WZ (1998) Damping in reflexively active and areflexive lengthening muscle
evaluated with inertial loads. Journal of Neurophysiology, 80, 3369-3372.
Loram ID, Kelly S, Lakie, M (2001) Human balancing of an inverted pendulum: is sway size
controlled by ankle impedance? Journal of. Physiology, 532, 879-891.
Loram ID, Lakie M (2002a) Human balancing of an inverted pendulum: position control by small,
ballistic-like, throw and catch movements. Journal of Physiology, 540, 1111-1124.
Loram ID, Lakie M (2002b) Direct measurement of human ankle stiffness during quiet standing: the
intrinsic mechanical stiffness is insufficient for stability. Journal of Physiology, 545, 1041-1053..
Marr D (1969) A theory of cerebellar cortex. Journal of Physiology, 202, 437-470.
Massaquoi S, Hallett M (1996) Kinematics of initiating a two-joint arm movement in patients with
cerebellar ataxia. Canadian Journal of Neurological Science, 23, 3-14.
McIntyre J, Mussa-Ivaldi F A, Bizzi, E (1996) The control of stable postures in the multijoint arm.
Experimental Brain Research, 110, 248-264.
Morasso P (1981) Spatial control of arm movements. Experimental Brain Research, 42, 223-227.
Morasso P, Mussa Ivaldi FA (1982) Trajectory formation and handwriting: a computational model.
Biological Cybernetics, 45, 131-142.
Morasso P (1983) Three dimensional arm trajectories. Biological Cybernetics, 48, 187-194.
Morasso P, Schieppati M (1999) Can muscle stiffness alone stabilize upright standing? Journal of
Neurophysiology, 83, 1622-1626.
Morasso P, Sanguineti V (2002) Ankle stiffness alone cannot stabilize upright standing. Journal of
Neurophysiolog,y, 88, 2157-2162.
Morasso P, Re C, Sanguineti V (2002) A pilot study of the mechanisms of stabilization of the inverted
pendulum. Gait & Posture, 16, suppl 1, S209-210.
Morasso P, Casadio M, Re C, Sanguineti, V (2003) Motor control mechanisms in unstable tasks.
XVII IMEKO World Congress June 22−27, Dubrovnik, Croatia.
Mussa-Ivaldi FA, Hogan N, Bizzi E (1985) Neural, mechanical, and geometric factors subserving arm
posture in humans. Journal of Neuroscience, 5, 2732-2743.
Mussa Ivaldi F A, Morasso P, Zaccaria R (1988) Kinematic Networks. A Distributed Model for
Representing and Regularizing Motor Redundancy. Biological Cybernetics, 60, 1-16.
Piaget J (1963) The origin of intelligence in children. Norton Press, New York.
Rack PMH, Westbury DR (1969) The effects of length and stimulus rate on tension in isometric cat
soleus muscle. Journal of Physiology, 204, 443-460.
Reger BD, Fleming KM, Sanguineti V, Alford S, Mussa-Ivaldi FA (2000) Connecting Brains to
Robots: An Artificial Body for Studying the Computational Properties of Neural Tissues.
Artificial Life, 6, 307–324.
Rosenbaum DA (1991) Human motor control. Academic Press, New York.
Sainburg RL, Ghez C, Kalakanis D (1999) Intersegmental dynamics are controlled by sequential
anticipatory, error correction, and postural mechanisms. Journal of Neurophysiology, 81, 10451056.
Sanguineti V, Morasso P, Baratto L, Brichetto G, Mancardi GL., Solaro, C (2003) Cerebellar ataxia:
Quantitative assessment and cybernetic interpretation. Human Movement Science, 22, 189–205.
Shadmehr R, Mussa-Ivaldi FA (1994) Adaptive representation of dynamics during learning of a motor
task. Journal of Neuroscience, 14, 3208-3224.
Sherrington CS (1906) The Integrative Action of the Nervous System. Cambridge University Press,
Cambridge.
Smith MA, Brandt J, Shadmehr R (2000) Motor disorder in Huntington's disease begins as a
dysfunction in error feedback control. Nature, 403, 544-549.
Thoroughman KA, Shadmehr R (1999) Electromyographic Correlates of Learning an Internal Model
of Reaching Movements. Journal of Neuroscience, 19, 8573–8588.
Thoroughman KA, Shadmehr R (2000) Learning of action through adaptive combination of motor
primitives. Nature, 407, 742-747.
Topka H, Konczak J, Dichgans J (1998a) Coordination of multi-joint arm movements in cerebellar
ataxia: analysis of hand and angular kinematics. Epxerimental Brain Research, 119, 483-492.
Topka H, Konczak J, Schneider K, Boose A, Dichgans J (1998b) Multijoint arm movements in
cerebellar ataxia: abnormal control of movement dynamics. Experimental Brain Research, 119,
493-503.
Tsuji T, Morasso P, Goto K, Ito K (1995) Human hand impedance characteristics during maintained
posture. Biological Cybernetics, 72, 475-485.
Uno Y, Kawato M, Suzuki R (1989) Formation and control of optimal trajectory in human multijoint
arm movement: Minimum torque-change model. Biological Cybernetics, 61, 89-101.
Wessberg J, Stambaugh CR, Kralik JD, Beck PD, Laubach M, Chapin JK, Kim J, Biggs SJ, Srinivasan
MA, Nicolelis MA (2000) Real-time prediction of hand trajectory by ensembles of cortical
neurons in primates. Nature, 408, 361-365.
Wilson DM (1961) The central nervous control of flight in a locust. Journal of Experimental Biology,
38, 471-490.
Winter DA, Patla AE, Riedtyk S, Ishac MG (1998) Stiffness control of balance in quiet standing.
Journal of Neurophysiology, 80, 1211-1221.
Winters JM (1995) How detailed should muscle models be to understand multi-joint movement
coordination. Human Movement Science, 14, 401-442.
Wolpert DM, Ghahramani Z, Jordan MI (1995) An internal model for sensorimotor integration.
Science,. 269,1880-1882.
Wolpert DM, Kawato M (1998) Internal models of the cerebellum. Trends in Cognitive Science, 2,
338-347.
Won J, Hogan N (1995) Stability properties of human reaching movements.
Experimental Brain Research, 107, 125-136.
Woodworth RS (1899) The accuracy of voluntary movement. Psychological Review Monograph
Supplements, 3, no. 3.
FIGURA 1 Decomposizione logica della generazione di un movimento in una sequenza di processi
computazionali
FIGURA 2 Nei movimenti di reaching, le traiettorie della mano sono rettilinee e con un
profilo di velocità a campana, indipendentemente da direzione e ampiezza del movimento
(da Morasso 1981)
FIGURA 3. Forze interne ed esterne in una catena cinematica. Fext è il carico applicato
all’effettore terminale e τ i sono le coppie generate dagli attuatori. Nel paradigma di moto
passivo, Fext è definite dalla traiettoria pianificata e i τ i corrispondono alla “compliance”
passiva delle articolazioni in risposta alla ‘trazione’ pianificata.
FIGURA 4. Forze di interazione dinamica nei movimenti di un braccio planare a due gradi di libertà. A
partire dalla posizione di partenza indicata a sinistra (50 cm dalla spalla, con il gomito flesso a 90°), sono
stati considerati 8 diversi movimenti in direzioni spaziate di 45°. Le traiettorie sono state generate
utilizzando il modello minimum-jerk (vedi testo; durata: 0.7s, ampiezza 20 cm). A destra sono
visualizzate le corrispondenti coppie generate dagli attuatori, visualizzate come forze equivalenti
applicate alla mano. Parametri del modello: braccio: massa 2 kg, lunghezza 30 cm; avambraccio: massa 2
kg, lunghezza 40 cm.
FIGURA 5. Confronto fra le proprietà meccaniche di un motore a corrente continua (in alto) e di un
muscolo (in basso). La figura riporta gli andamenti delle caratteristiche sforzo-flusso (ossia, forzavelocità generalizzate) e sforzo-spostamento
FIGURA 6. Schema concettuale del procedimento per la stima della stiffness della mano. Come
mostrato a sinistra, un manico impugnabile trasmette alla mano piccole e rapide perturbazioni di
posizione dX per mezzo di un braccio robotizzato, a partire da una configurazione di equilibrio
prefissata. La corrispondente forza di richiamo, dF, viene misurata mediante un sensore di forza e la
misura è ripetuta per diverse direzioni. I dati così ottenuti vengono utilizzati per il fitting di un
modello dinamico lineare del 2° ordine (ossia un sistema massa-molla smorzato), che risulta in una
stima della matrice di stiffness, K, di viscosità, B e di inerzia, M. A destra è indicata mediante un
ellisse la struttura geometrica della matrice di stiffness (ellisse di stiffness) per diverse configurazioni
del braccio.
FIGURA 7. Schemi di controllo alternativi. In alto: controllo feedforward, basato su un modello interno
(inverso) della dinamica. Al centro: controllo a feedback con ritardo. In basso: controllo a feedback che
utilizza un osservatore dello stato, alimentato con riafferenze sensoriali e copia efferente.
FIGURA 8. Modello di apprendimento feedback error learning. Il “feedback controller” è un regolatore
standard, per esempio di tipo proporzionale/derivativo, e genera il “feedback motor command” che
agisce anche da segnale di addestramento per il “feedforward controllor” unitamente ad una copia della
traiettoria desiderata (“desired trajectory”) e di quella effettiva (“actual trajectory”). Il “motor
command” complessivo è la somma dei due comandi motori: all’inizio dell’addestramento prevale il
comando feedback e alla fine quello feedforward. Nell’interpretazione neurobiologica il controllore
feedforward è localizzato nella “cerebellar cortex”; i neuroni nascosti corrispondono alle cellule
granulari e i neuroni d’uscita alle cellule di Purkinje; i segnali di ingresso alla rete sono portati dalle
fibre muschiate e i segnali di addestramento dalle fibre rampicanti, che utilizzano per come segnali di
addestramento gli spike complessi.
FIGURA 9. Diagramma di Bode relativo a un sistema massa-molla smorzato, controllato
mediante un controllore PD. Il margine di fase viene calcolato considerando la pulsazione a cui
l’ampiezza è 0 dB (nel diagramma, 36 rad/s) e misurando la differenza fra il valore critico della
fase (-180°) e il suo valore attuale. A questa frequenza il margine di fase è 84°. La stabilità
richiede un margine di fase positivo; esso inoltre deve essere superiore a 45° affinché lo
smorzamento sia sufficiente.
FIGURA 10. Precisione della stima della posizione di un braccio in movimento in assenza di
visione, in funzione della durata del movimento (Wolpert e coll. 1995). A sinistra: andamento
predetto da un modello dell’integrazione senso-motoria basato su un filtro di Kalman. L’errore
tende inizialmente a crescere perché nella stima prevale il contributo della copia efferente, che
produce una accumulazione dell’errore; in seguito la componente sensoriale diventa sempre più
affidabile e l’errore torna a diminuire. A destra, l’andamento osservato sperimentalmente.
FIGURA 11. Movimenti planari dell’arto superiore in soggetti cerebellari. In alto: traiettorie della mano e
profili di velocità tipici, relativi a un soggetto sano (a sinistra) e uno con atrofia cerebellare degenerativa (a
destra). In basso, da sinistra a destra: orientazione dell’ellisse di inerzia e dipendenza dell’errore di mira
dalla direzione del movimento rispetto all’asse principale dell’ellisse di inerzia, in soggetti di controllo e in
soggetti cerebellari (da Sanguineti e coll. 2003).
FIGURA 12. Effetto di lesioni al sistema nervoso sulla coordinazione (da Gilman e coll. 1976). In alto, apparato e
task sperimentale. In basso, da sinistra a destra: traiettoria della mano di un soggetto intatto (CO), deafferentato
(DA), decerebellato (DB) , e deafferentato e decerebellato.
FIGURA 13. Controllo della stazione eretta. A sinistra: modello a pendolo invertito (COM: centro di
massa; COP: centro di pressione). A destra: oscillazioni di COM e COP nel piano sagittale.
Figure 14. Piattaforma motorizzata rotante, montata sopra una piattaforma di forza. A sinistra:
apparato sperimentale. A destra: rotazione θ(t) della caviglia e spostamento y(t) del COP. Durante
una rapida rotazione della piattaforma ( ∆θ = 10 , ∆T = 150 ms ), il COM è praticamente costante
e lo spostamento del COP ( ∆y ) può essere completamente attribuito alla stiffness della caviglia, la
quale può essere stimata mediante l’equazione: mg∆y = K s ∆θ .