SISTEMI LINEARI, METODO DI GAUSS Abbiamo visto che un

Transcript

SISTEMI LINEARI, METODO DI GAUSS Abbiamo visto che un
SISTEMI LINEARI, METODO DI GAUSS
Abbiamo visto che un sistema di m equazioni lineari in n incognite si può rappresentare in forma matriciale
come A · x = b dove:
A è la matrice di tipo (m, n) dei coefficienti del sistema,
x è il vettore colonna delle incognite,
b è il vettore colonna dei termini noti.
Abbiamo anche visto che, nel caso m = n (sistema “quadrato”), la condizione det(A) 6= 0 garantisce
l’esistenza di una e una sola soluzione (cioè una e una sola n-upla di valori delle incognite che sostituiti nelle
n equazioni le soddisfano contemporaneamente) e che tale soluzione ha la forma x = A−1 · b (metodo di
Cramer) il calcolo della quale è peraltro molto pesante non appena n > 3; se invece det(A) = 0 possono
esserci infinite o nessuna soluzione; se poi m 6= n non si può nemmeno parlare di determinante.
In tutti questi casi il metodo di eliminazione di Gauss risolve ogni incertezza e permette di calcolare le
eventuali soluzioni con un numero di operazioni minore di quello necessario per il metodo di Cramer.
Consideriamo tre esempi:


 x + 2y − z = 1
y + 2z = 0


z = −1


 x + y + 2z + 3v + 3w = 1
y + 2z + 3v + 4w = 0


w=0


 x + y + 2z + 3v + 3w = 1
y + 2z + 3v + 4w = 0


0w = 1
Il primo sistema si risolve facilmente dal basso: sostituendo nella seconda equazione il valore di z dato dalla
terza si ha y = 2; sostituendo i valori di z e y nella prima si ricava x = −4. Abbiamo quindi una e una sola
soluzione {x = −4, y = 2, z = −1} ottenibile con pochissimi conti.
Anche il secondo sistema si risolve facilmente dal basso, ricavando da ogni equazione la variabile che compare
più a sinistra con coefficiente diverso da zero:
dalla terza equazione si ha w = 0; sostituendo nella seconda si ottiene y = −2z − 3v; sostituendo ancora i
valori trovati per w e y nella prima si ricava x = 1. Osserviamo che le soluzioni
{x = 1, y = −2z − 3v, z qualsiasi, v qualsiasi, w = 0}
sono una doppia infinità perché sono espresse in funzione di due parametri z e v che possono assumere valori
arbitrari.
Il terzo sistema è invece impossibile per la presenza della terza equazione, che non ammette soluzioni.
Consideriamo ore le matrici dei coefficienti dei tre sistemi,
colonna dei termini noti per ottenere la cosidetta “matrice



1 1 2 3 3 |
1 2 −1 | 1
0 1 2 | 0 
0 1 2 3 4 |
0 0 1 | −1
0 0 0 0 1 |
a ognuna delle quali
orlata” 1 :


1
1 1
0 1
0
0 0
0
è accostata, a destra, la

2 3 3 | 1
2 3 4 | 0
0 0 0 | 1
In tutti e tre i casi il numero di zeri con cui inizia una riga è strettamente maggiore di quello della riga
precedente. Matrici che godono di questa proprietà si dicono “a scalini”.
Osserviamo che per i primi due sistemi, il numero r = 3 di righe con almeno un elemento diverso da zero
(che, per una matrice a scalini, dicesi caratteristica o rango), non aumenta passando dalla matrice dei
coefficienti alla sua orlata. È questo fatto che assicura l’esistenza di soluzioni. Inoltre nel primo caso, dove
il rango r = 3 è uguale al numero n di incognite, esiste una e una sola soluzione. Invece nel secondo, dove
n = 5 mentre r = 3, esistono ∞n−r = ∞2 soluzioni.
Nel terzo caso invece la matrice dei coefficienti ha rango 2, mentre quella orlata ha rango 3, e questa diversità
del rango delle due matrici determina la mancanza di soluzioni del sistema corrispondente.
1
Per esempio, per il primo sistema la matrice dei coefficienti e la matrice orlata sono rispettivamente:




1 2 −1
1 2 −1 | 1
0 1 2 
0 1 2 | 0 
0 0 1 | −1
0 0 1
1
Il metodo di eliminazione di Gauss per la risoluzione di un sistema lineare, consiste nel cercare di trasformare
il sistema in uno equivalente (cioè con le stesse soluzioni), ma che sia del tipo di uno dei tre sistemi visti,
cioè con la matrice dei coefficienti (orlata) nella forma a scalini.
Precisiamo meglio i concetti esposti.
Il metodo di Gauss è basato sul fatto che se si applicano a un sistema lineare una o più delle tre operazioni
elementari seguenti, si ottiene un sistema equivalente al precedente, (cioè che ammette tutte e sole le
soluzioni di quello di partenza). Le operazioni elementari sono:
1) Scambiare fra loro due equazioni.
2) Moltiplicare ambo i membri di una equazione per uno stesso numero diverso da zero.
3) Sostituire a una equazione la sua somma con una qualsiasi combinazione lineare di alcune altre.
(Nel caso più semplice: sommare a una equazione un’altra equazione moltiplicata per un numero)
Naturalmente è sufficiente fare queste operazioni sulle righe della matrice A|b (matrice orlata), che si
ottiene accostando, a destra della matrice dei coefficienti, la colonna dei termini noti.
Lo scopo è quello di ottenere una matrice A0 |b0 che chiameremo equivalente alla precedente, che sia nella
cosidetta forma a scalini: ogni riga deve cominciare con un numero di elementi nulli più grande di quello
della riga precedente. Per esempio, la prima delle tre matrici seguenti è a scalini, le altre due no.

1
0
0
2
9
0
3
8
0

4
7
5

1
0
0
2
9
3
3
8
2

4
7
5

1
0
0
2
0
3
3
8
6

4
7
5
È sempre possibile, con una opportuna serie di operazioni elementari, arrivare a una forma equivalente a
scalini. Il risultato può variare a seconda delle operazioni effettuate, ma il sistema lineare corrispondente
alla matrice a scalini trovata ha comunque le stesse soluzioni di quello di partenza.
Si può inoltre dimostrare che il numero di righe con almeno un elemento non nullo di una matrice a scalini
A0 equivalente ad A dipende solo da A e non dalle operazioni scelte per arrivare ad A0 . Tale numero dicesi
caratteristica2 o rango di A. Analogamente si definisce la caratteristica della matrice orlata A|b.
Vale anche il:
Teorema (di Rouchè Capelli): Un sistema di m equazioni lineari in n incognite ammette soluzioni se
e solo se la caratteristica r della matrice dei coefficienti A è uguale a quella della matrice orlata A|b. In
questo caso il sistema ammette ∞n−r soluzioni (una e una sola se n = r).
Quando la condizione di esistenza delle soluzioni è soddisfatta, il loro calcolo si esegue sul sistema a scalini,
caratterizzato dalla matrice A0 |b0 , equivalente a quello di partenza, come abbiamo visto negli esempi.
Come si arriva alla forma a scalini.
La strategia da seguire è la seguente:
a) portare al primo posto una riga che cominci con il minor numero di zeri.
b) con la terza operazione elementare far diventare zero tutti gli elementi della colonna sottostante il primo
elemento diverso da zero della prima riga
c) ripetere il procedimento dalla seconda riga in giù, poi dalla terza in giù, etc. . . .
Esempio

y + 2z + 3v + 4w = 0




 2x + 2y + 4z + 6v + 7w = 2

x + y + 2z + 3v + 3w = 1




−2x − y − 2z − 3v − 2w = −2
2
Si può dimostrare che la definizione di caratteristica appena vista è equivalente (da un punto di vista teorico,
ma più utile per semplificare i calcoli) a quella classica, secondo la quale la caratteristica di una matrice
è l’ordine della più grande sottomatrice quadrata a determinanate diverso da zero contenuta nella matrice
data.
2
Passiamo alla matrice dei coefficienti, orlata con la colonna dei termini noti:
0
1
2
3
4
2
4
6
7
 2

1
1
2
3
3
−2 −1 −2 −3 −2


| 0
| 2 

| 1
| −2
a) scambiando la prima riga con la terza, in modo che la nuova prima riga cominci con un elemento diverso
da zero, otteniamo:


1
1
2
3
3 | 1
2
4
6
7 | 2 
 2


0
1
2
3
4 | 0
−2 −1 −2 −3 −2 | −2
b) sommando alla seconda riga la prima moltiplicata per −2 e sommando alla quarta riga la prima moltiplicata per 2 otteniamo:

1 1 2 3 3 | 1
0 0 0 0 1 | 0


0 1 2 3 4 | 0
0 1 2 3 4 | 0

adesso sotto al primo elemento della prima riga ci sono solo zeri, quindi:
c) ripetiamo il procedimento a partire dalla seconda riga in giù:
a) scambiando la seconda e la terza riga otteniamo:

1 1 2 3 3 | 1
0 1 2 3 4 | 0


0 0 0 0 1 | 0
0 1 2 3 4 | 0

b) sommando alla quarta la seconda riga moltiplicata per −1 otteniamo:
1
0

0
0

1
1
0
0
2
2
0
0
3
3
0
0
3
4
1
0
|
|
|
|

1
0

0
0
che è una matrice a scalini, corrispondente a un sistema lineare equivalente a quello di partenza. Si vede
facilmente che questo nuovo sistema coincide con il secondo dei tre sistemi considerati all’inizio del paragrafo,
dove è già stato risolto; infatti l’equazione corrispondente all’ultima riga, avendo coefficienti e termine noto
tutti nulli, può essere soppressa senza alterare le soluzioni.
Diamo la ricetta generale per discutere un sistema a scalini:
Come si risolve un sistema a scalini.
Per prima cosa si constata se la matrice dei coefficienti e la sua orlata hanno la stessa caratteristica, altrimenti
il sistema è impossibile.
Se questa condizione è soddisfatta, si cancellano le (eventuali) ultime m − r equazioni che hanno i coefficienti
e il termine noto tutti nulli.
Rimangono r equazioni: per ciasuna di esse si sceglie la variabile che appare al primo posto da sinistra in
quanto è la prima con coefficiente diverso da zero.
Le altre n − r variabili si portano a destra dei segni di uguale e si considerano come parametri che possono
variare liberamente.
Si ottiene cosı̀ un sistema quadrato di r equazioni in r incognite con termini noti dipendenti da n − r
parametri, la cui matrice dei coefficienti ha tutti gli elementi sotto alla diagonale uguali a zero.
Dall’ultima equazione si ricava il valore dell’unica incognita che vi compare, lo si sostituisce nella penultima,
che diventa cosı̀ in una sola incognita; si ricava quest’ultima e cosı̀ via a ritroso fino alla prima equazione e
alla prima incognita.
Le soluzioni resteranno espresse in funzione delle n − r incognite portate a destra come parametri arbitrari:
si dice allora che si hanno n−r soluzioni.
3
ESERCIZI
1)
Discutere il sistema lineare omogeneo:






x2 + x4 = 0
x1 + x3 + x5 = 0

2x1 + x2 + 2x3 + x4 + 2x5 = 0




x1 + x2 + x3 + x4 + x5 = 0
Passiamo alle matrici asociate:
0
1

2
1
1
0
1
1

0
1
2
1
1
0
1
1
0
1
2
1
|
|
|
|

0
0

0
0
Scambiamo le prime due righe, poi sommiamo la (nuova) prima riga moltiplicata per −2 alla terza, e,
moltiplicata per −1, alla quarta.
Nella matrice cosı́ ottenuta (che ha le ultime tre righe uguali) annulliamo le ultime due, sottraendo loro la
seconda. Perveniamo a una matrice a scalini di caratteristica 2 che soddisfa il teorema di Rouché-Capelli
(della quale scriviamo solo le prime due righe perché le ultime due sono tutte nulle):
1
0
0
1
1
0
0
1
1 | 0
0 | 0
che corrisponde al sistema:
(
x1 + x3 + x5 = 0
x2 + x4 = 0
Teniamo a sinistra le variabili x1 e x2 , e portiamo a destra le altre tre, ottenendo:
(
x1 = −x3 − x5
x2 = −x4
Si hanno quindi ∞3 soluzioni
{x1 = −x3 − x5 ,
x2 = −x4 ,
x3 = x3 ,
x4 = x4 ,
x5 = x5 }
Possiamo anche scrivere le soluzioni come combinazione lineare di tre di esse, indipendenti fra loro (quella
che chiameremo una “base”). Queste tre soluzioni le otteniamo dando alle “variabili parametro” x3 , x4 , x5 :
prima la terna di valori (1, 0, 0) ottenendo s1 = {−1, 0, 1, 0, 0},
poi la terna (0, 1, 0) ottenendo s2 = {0, −1, 0, 1, 0},
e infine la terna (0, 0, 1) ottenendo s3 = {−1, 0, 0, 0, 1}.
Si ha infatti:






 
−1
0
−1
x1
 0 
 −1 
 0 
 x2 






 
 x3  = x3  1  + x4  0  + x5  0 






 
0
1
0
x4
1
0
0
x5
In questo caso abbiamo potuto scrivere le soluzioni come combinazione lineare di tre di esse perché il sistema
era omogeneo, cioè con tutti i termini noti uguali a zero.
Se il sistema non è omogeneo (vedi esercizio 2), si può dimostrare che le sue soluzioni si possono scrivere
come somma di una qualsiasi di esse con la generica soluzione del sistema omogeneo associato (che si ottiene
annullando tutti i termini noti). A sua volta la generica soluzione del sistema omogeneo associato si può
scrivere, come nell’esempio appena visto, come combinazione lineare di un numero (finito e uguale a n − r)
di soluzioni del sistema omogeneo, scelte come le s1 , s2 , . . . appena viste, e quindi linearmente indipendenti.
Questa struttura dell’insieme delle soluzioni è comune a tutti i problemi lineari: la ritroveremo per esempio quando descriveremo l’insieme delle soluzioni di una equazione differenziale lineare di ordine n (o,
equivalentemente di un sistema di n equazioni differenziali lineari del primo ordine).
4
2)
Stabilire per quali valori dei parametri reali α e β il seguente sistema lineare ammette ∞2 soluzioni
e calcolarle.

2x + y − z + w = 5





x + y − z + 2w = 2

x − αw = 3




3x + 2y − βz + 3w = 7
Passiamo alle matrici asociate:
2
1

1
3

1 −1
1 −1
0 0
2 −β
1
2
−α
3
|
|
|
|

5
2

3
7
Scambiamo la prima riga con la terza, in modo da evitare espressioni frazionarie quando useremo la prima
riga per annullare la colonna sotto al suo primo elemento:3
1
1

2
3

−α
2
1
3
0 0
1 −1
1 −1
2 −β
|
|
|
|

3
2

5
7
Agendo con la prima riga sulle sottostanti tre otteniamo:
1
0

0
0

0 0
1 −1
1 −1
2 −β
−α
2+α
1 + 2α
3 + 3α
|
|
|
|

3
−1 

−1
−2
Agendo con la seconda riga sulla terza e sulla quarta:
1 0
0
−1
0 1

0 0
0
0 0 2−β

−α
2+α
α−1
α−1

| 3
| −1 

| 0
| 0
Dovremmo ora scambiare le ultime due righe per ottenere una matrice a gradini, ma si vede già che ponendo
α = 1 e β = 2 si annullano le ultime due righe e si ottengono le matrici:
1 0 0 −1 |
0 1 −1 3 |
3
−1
che caratterizzano un sistema di caratteristica 2 che soddisfa il teorema di Rouché-Capelli e che quindi avrà
∞4−2 = ∞2 soluzioni:
{x = 3 + w, y = −1 + z − 3w, z = z, w = w}
che si possono scrivere come segue, secondo quanto osservato alla fine dell’esercizio precedente a proposito
dei sistemi non omogenei:
  
 



x
3
0
1
 y   −1 
1
 −3 
 =
+z +w

z
0
1
0
w
0
0
1
È facile verificare che (3, −1, 0, 0) è una soluzione del sistema non omogeneo di partenza (nel quale si sia posto
α = 1, β = 2), mentre la restante parte della combinazione lineare qui sopra dà la soluzione generale del
sistema omogeneo associato (sempre per α = 1, β = 2).
3
In realtà quando si opera con numeri decimali approssimati anziché con interi, è meglio portare al primo
posto la riga che inizia col coefficiente più grande in valore assoluto (in questo caso l’ultima); in tal modo si
minimizzano gli errori di approssimazione. Queste considerazioni sono oggetto dei corsi di Calcolo Numerico
5
3)
Stabilire per quali valori del parametro reale α il seguente sistema lineare ammette soluzioni, e
calcolarle per α = 0:

−x1 + 2x2 − x3 + x4 = 4




 2x1 + x2 + x3 − x4 = 3

x1 − x4 = −2




x2 + αx3 − x4 = −1
Risposta:
4)
3).
=1
= −1
=0
=0
{x1 = −1, x2 = −2 − x3 , x3 = x3 ,
  



x1
0
−1
 x2   −2 
 −1 
 =
 + x3 

x3
0
1
x4
−1
0
x4 = −1},
equivalentemente:
Ha ∞2 soluzioni
{x1 = −x3 , x2 = −x4 , x3 = x3 , x4 = x4 ,
 




x1
−1
0
 x2 
 −1 
 0 
 




 x3  = x3  1  + x4  0 
 




x4
0
1
0
0
x5
x5 = 0},
Discutere il sistema omogeneo Ax = 0 dove:


1 2 1 2
 2 2 1 4 


A= 1 0 0 2 


3 2 1 6
−1 0 0 −2
Risposta:
7)
Ha ∞1 soluzioni
2, 2,
Discutere il sistema omogeneo Ax = 0 dove:


2 1 2 1 2
 −2 2 −2 2 1 
A=

2 4 2 4 4
0 0 0 0 1
Risposta:
6)
Per α = 0 ha l’unica soluzione (1,
Discutere il seguente sistema lineare:

−x2 − x3 + x4




 x1 + x2 + x3 − 2x4

x1 − x4




2x1 − x2 − x3
Risposta:
5)
Ammette soluzioni per α 6= −2.
Ha ∞2 soluzioni
{x1 = −2x4 , x2 = − x23 , x3 = x3 , x4 = x4 },
 




x1
0
−2
1
 x2 
− 
 0 
  = x3  2  + x4 

x3
1
0
x4
0
1
ossia:
Stabilire per quali valori di α reale il seguente sistema lineare è impossibile:


 x+y+z =α
3x − 2y − z = 0


2x + y + αz = α − 3
Risposta:
per α =
6
5
6
ossia: