UNISA

Transcript

UNISA
STRUTTURA DELLE RETI SOCIALI
COMPORTAMENTI LOCALI E
FENOMENI GLOBALI
Vincenzo Auletta

Autunno 2012
COMPORTAMENTI LOCALI E FENOMENI
GLOBALI
Struttura delle Reti Sociali
Le network sono uno strumento utilissimo per
descrivere il rapporto tra i comportamenti locali dei
singoli ed i fenomeni globali che si verificano in una
popolazione
Come l’informazione viaggia nella rete?
 Come diversi archi possono svolgere funzioni diverse
nella diffusione delle infromazioni?
 Come in una rete sociale diversi nodi possono svolgere
ruoli distinti e come fare a riconoscerli?
 Come questi processi condizionano l’evoluzione della rete
nel tempo?

1
ESPERIMENTO DI GRANOVETTER (1970)
Autunno 2012

Struttura delle Reti Sociali
Granovetter per la sua tesi di dottorato intervistò
numerose persone che avevano appena trovato
lavoro per come erano venuti a conoscenza
dell’offerta di lavoro
Nella maggior parte dei casi da contatti personali
 Più spesso da conoscenti che da amici


Conclusione sorprendente
Gli amici dovrebbbero essere quelli che più ci tengono ad
aiutare e fornire notizie utili
 Perché i conoscenti sono più utili nella ricerca di un
nuovo lavoro?

2
TESI DI GRANOVETTER

A livello locale


L’amicizia può essere forte o debole
A livello globale


Struttura delle Reti Sociali
Due diversi modi di vedere l’amicizia
Autunno 2012

L’amicizia può legare due nodi vicini o lontani nella rete
Spiegazione di Granovetter
Le informazioni viaggiano sui link che collegano parti
diverse della rete
 Questi link tendono a rappresentare amicizie deboli
 Teoria della “Strength of Weak Ties”

3
TRIADIC CLOSURE
Autunno 2012

B
Struttura delle Reti Sociali
In una rete sociale se due nodi hanno un amico in
comune hanno buone probabilità di diventare amici
in futuro
C
A

Motivazioni sociologiche
I due nodi hanno maggiori occasioni di incontrarsi e
frequentarsi
 Se hanno un amico comune tendono a fidarsi dell’amico
e ad accettare l’altro
 L’amico comune tende a favorire la loro amicizia per non
doversi dividere tra i due

4
COEFFICIENTE DI CLUSTERIZZAZIONE
Se osserviamo l’evolversi di una rete sociale nel
tempo noteremo la tendenza alla chiusura di tutti i
triangoli
Struttura delle Reti Sociali

Autunno 2012

Coefficiente di clusterizzazione
Probabilità che due nodi scelti a caso tra gli amici di un
nodo siano amici tra loro
 Più è forte la triadic closure maggiore sarà il coefficiente
di clusterizzazione


Bearman e Moody hanno scoperto empiricamente
che ragazze con basso coefficiente di
clusterizzazione sono più propense al suicidi
5
FORZA DEL LEGAME
Autunno 2012

Secondo Granovetter il legame interpersonale può
essere di tue tipi
strong: amicizia
 weak: conoscenza
 Proprietà locale

Struttura delle Reti Sociali

Proprietà della Strong Triadic Closure
Ipotesi operativa di Granovetter
 Se A ha legami strong con B e C allora con alta
probabilità c’è un’amcicizia tra B e C


Può essere strong o weak
SoW
B
S
C
S
A
6
BRIDGE
Un bridge è un arco che collega due componenti
distinte della rete
Proprietà globale della rete
B
C
A
D
bridge
F
G
E
H
Struttura delle Reti Sociali


Autunno 2012

Un bridge è un arco che non appartiene ad un
triangolo

In una rete sociale i bridge sono rari
7
LOCAL BRIDGE
Autunno 2012

Un local bridge è un arco che riduce la distanza tra
una coppia di nodi
Svolge funzione simile al bridge
 Proprietà globale della rete
Lo span di un local
bridge è la distanza tra i
suoi estremi se
togliessimo l’arco

Maggiore lo span più
importante il ruolo di
coesione dell’arco
N
M
O
I
L
B
C
A
D
Span = 4
Struttura delle Reti Sociali

local
bridge
F
G
E
H
8
STRENGTH OF WEAK TIES
Autunno 2012
A
l.b.
C
•
•
•
B
•
•
•
Struttura delle Reti Sociali
Assumiamo la Strong Triadic Closure
 Se un nodo ha almeno due strong ties allora ogni
local bridge a cui è adiacente è un weak tie
Sia AB un local bridge
AB e BC strong ties
BC non può esistere perchè AB non può stare in
un triangolo
BC esiste per STC -- CONTRADDIZIONE
Quindi AB non può essere uno strong tie
Quindi
Se la rete ha un numero sufficiente di strong ties allora ogni
local bridge è un weak tie
 Le informazioni cruciali viaggiano sui weak tie
 Collega una proprietà globale (local bridge) ad un
comportamento locale (strength of tie)

9
FORZA DEI LEGAMI IN DATA-SET REALI
Per molti anni non si è potuto verificare le teorie di
Granovetter su network di grandi dimensioni e in
contesti realistici

Oggi abbiamo dati per reti “who-talks-to-whom” di
grandi dimensioni


Mancanza di dati concreti
Facebook, social networks, tabulati telefonici, email
Onnela e al. 2007
Dati di un provider di telefonia cellulare che copriva il 20%
della popolazione statunitense
 Periodo di osservazione 18 settimane
 Due utenti sono collegati se hanno scambiato almeno una
telefonata in entrambe le direzioni
 La forza del legame è misurata dal numero di minuti di
comunicazione
Struttura delle Reti Sociali

Autunno 2012


10
NEIGHBORHOOD OVERLAP
Neighborhood overlap di A e B ( NO(A, B) )
N
M
O
I
L
Struttura delle Reti Sociali
NO(A, B) = #(vicini comuni ad A e B)/ #(vicini ad A o B)
 Se AB è un local bridge  NO(A, B) = 0
 Nodi con piccolo neighborhood overlap sono “quasi” dei
local bridge.

Autunno 2012

1/6
B
0
C
F
G
E
H
1/4
A
D
11
Ad ogni arco è assegnato
il suo percentile

Conferma la connessione tra la forza dei legami
(locale) e la neighborhood overlap (globale)
Struttura delle Reti Sociali
Archi ordinati in
maniera decrescente per
forza del legame
Autunno 2012
RISULTATI EMPIRICI SU FORZA DEI LEGAMI
E NEIGHBORHOOD OVERLAP
12
IPOTESI DI ONNELA ET AL.
La rete è fatta da comunità densamente legate da
legami forti collegate da legami deboli

I legami deboli svolgono un ruolo fondamentale nel
tenere unita la comunità
Esperimento:
Cancella gli archi uno alla volta in ordine decrescente
di forza
1.

Struttura delle Reti Sociali

Autunno 2012

La dimensione della componente gigante diminuisce
gradualmente
Cancella gli archi uno alla volta in ordine crescente di
forza
2.
1.
La dimensione della componente gigante diminuisce molto
più velocemente
13
FORZA DEI LEGAMI NEI SOCIAL NETWORKS
L’utilizzo sempre più diffuso dei social networks
come ha modificato il comportamento degli utenti?

Numerosi esperimenti condotti su principali social
networks (facebook, twitter)
Gli utenti di un social network tendono ad avere
molti più contatti ma con minor forza dei legami

Molto diffuso il fenomeno del passive engagement


Struttura delle Reti Sociali

Autunno 2012

una persona ne segue un’altra attraverso le notifiche ma senza
mantenere contatti diretti
Le informazioni fluiscono molto più velocemente
14
RUOLO DEI NODI IN UNA SOCIAL NETWORK
La discussione precedente ha riguardato gli archi
della rete

Archi diversi svolgono ruoli differenti
E per i nodi?

Possiamo individuare ruoli diversi dei nodi a seconda
della loro posizione nella rete?
Struttura delle Reti Sociali

Autunno 2012

15
EMBEDDEDNESS E STRUCTURAL HOLES
Embeddedness di un arco AB = #(vicini comuni ad A e B)

È il numeratore della funzione di neighborhood overlap

La fiducia tra i due nodi adiacenti cresce con l’embeddedness
dell’arco che li unisce

Se un nodo è adiacente ad archi con alta embeddedness ha più
facilità di relazione e maggiore fiducia nei suoi vicini

Uno structural hole indica l’assenza di connessioni tra due
aree della rete


Struttura delle Reti Sociali

Un local bridge ha embeddedness nulla
Autunno 2012

Tali buchi sono coperti dai local bridge
Un nodo adiacente ad uno structural hole può avere dei
vantaggi dalla sua posizione


Controlla il passaggio delle informazioni
Conosce le cose prima degli altri
16
UN ESEMPIO
Autunno 2012
Struttura delle Reti Sociali

A è circondato da archi con alta embeddedness

È incluso in una comunità molto coesa
B, C e D si trovano su uno structural hole
 Controllano tutte le interazioni tra le varie comunità

17
CENTRALITÀ DI UN NODO
Diverse misure di centralità legate a aspetti diversi
della rete
Degree centrality
 Closeness centrality
 Betweenness centrality
 Eigenvector centrality


Struttura delle Reti Sociali

Misura il ruolo svolto dal nodo nella rete
Autunno 2012

Definite in modo da fornire un valore in [0, 1]

Misurano l’”importanza” del nodo
18
DEGREE CENTRALITY
Degree centrality di z
F 1/3
1/3 A
1/3 B
Struttura delle Reti Sociali
grado(z)/(n-1)
 Misura l’importanza di un nodo in base al numero dei
suoi vicini

Autunno 2012

1/2
1/3
1/2
C
D
E
19
G 1/3
CLOSENESS CENTRALITY
Autunno 2012

Closeness centrality di z
(n-1)/∑u≠zd(u,z)
 Inverso della distanza media
 Misura la velocità con cui un nodo viene
raggiunto/raggiunge da tutti gli altri

6/15 B
Struttura delle Reti Sociali
F 6/15
6/15 A
6/11
3/5
6/11
C
D
E
20
G 6/15

∑u≠zd(u,z)
 Pesa maggiormente in nodi vicini
 Per   1
tende alla dimensione della componente in
cui si trova il nodo
 Per   0
tende al grado

Struttura delle Reti Sociali
Per far pesare di più i collegamenti con i nodi vicini
si può definire la centrality usando un parametro di
decadimento 0 <  < 1
Autunno 2012
CLOSENESS CENTRALITY CON PARAMETRO
DI DECADIMENTO
21
BETWEENESS CENTRALITY
Betweenness centrality di z



0 A
0 B
Struttura delle Reti Sociali

2 / (n-1)(n-2) ∑u≠v, z ≠ u,v Pz(u,v) / P(u,v)
P(u,v) = # cammini minimi tra u e v
Pz(u,v) = # cammini minimi tra u e v passanti per z
Misura quanto il nodo z è cruciale per la comunicazione
tra tutte le coppie di nodi
Autunno 2012

F 0
8/15
9/15
C
D
8/15
E
22
G 0
EIGENVECTOR CENTRALITY
Misura l’importanza di un nodo in funzione
dell’importanza dei suoi vicini

Cosa vi ricorda?
Cz(G) = ∑u≠z G u,z Cu(G)

In forma matriciale C(G) = G C(G)
C(G) è un autovettore per G e  è l’autovalore corrispondente
 Scegliamo l’autovalore più grande che per le reti considerate è
sempre nonnegativo

Struttura delle Reti Sociali

Autunno 2012

23
GRAPH PARTITIONING
Dalla discussione precedente ricaviamo un’idea di
struttura di una rete sociale

Come possiamo individuare le aree fittamente connesse
Identificare le comunità della rete è vitale per gli esperti di
marketing
 Problema algoritmico non banale


Struttura delle Reti Sociali
Un insieme di comunità fittamente connesse legate insieme da
legami occasionali
 Definizione volutamente informale

Autunno 2012

Numerosi metodi euristici per il graph partitioning

Metodi agglomerativi



Si parte dai singoli e si cerca di aggregarli in gruppi
Metodi divisivi
Si parte dalla rete in generale e si cerca di dividerla in
sottoreti connesse in modo sparso tra loro
24
UN ESEMPIO DI PARTIZIONAMENTO DI UNA
Autunno 2012
RETE IN COMUNITÀ
Struttura delle Reti Sociali
25
GRAPH PARTITIONING PER DIVISIONE
Basta individuare i local bridge?

No
Autunno 2012

Struttura delle Reti Sociali

Possibile soluzione
Calcoliamo la betweenness degli archi
 Gli archi con alta betweenness sono quelli su cui passa
la maggior parte dell’informazione

26
GRAPH PARTITIONING PER DIVISIONE

Ricalcola la betweeness di ogni arco e torna a passo 1
2.

3.

Se il grafo si divide in più componenti hai trovato le regioni in
cui si divide il grafo
Se una componente si divide in sottocomponenti queste sono
le regioni annidate nella regione padre
Procedi fin quando rimangono archi nel grafo
Struttura delle Reti Sociali
Trova gli archi con più alta betweeness e rimuovili dal
grafo
1.
Autunno 2012
Algoritmo di Girvan-Newman
L’algoritmo può essere adattato per calcolare
anche la betweenness dei nodi
27
ESEMPIO
Autunno 2012
Struttura delle Reti Sociali
28




Dipende dal numero di cammini minimi tra ogni coppia
di nodi
Si può fare efficientemente?
Idea
Struttura delle Reti Sociali
L’algoritmo di Girman-Newman ad ogni passo deve
ricalcolare la betweenness di tutti gli archi
rimanenti nel grafo
Autunno 2012
CALCOLO DELLA BETWEENNESS DEGLI
ARCHI
Utilizziamo una BFS da ogni nodo u
 Calcoliamo come un’unità di flusso si distribuisce nella
rete a partire da un nodo u

29

Algoritmo
1.
Se il nodo v si trova al k-imo livello dell’albero i cammini
minimi da u a v hanno lunghezza k e passano per i padri di v
nell’albero
 Il numero dei cammini minimi per v è la somma del numero di
cammini minimi per i suoi padri

3.
Struttura delle Reti Sociali
2.
A partire da ogni nodo u esegui una BFS e
costruisci l’albero dei percorsi minimi
Per ogni nodo v, calcola quanti cammini minimi
ci sono da u a v
Autunno 2012
ALGORITMO PER IL CALCOLO DELLA
BETWEENNESS
Determina quanto flusso attraversa ogni arco del
grafo
Bottom up
 Ad ogni nodo assegna un’unità di flusso più tutto quello che gli
arriva dai figli
 Ogni nodo distribuisce equalmente il proprio flusso tra i padri

30
ESEMPIO
Struttura delle Reti Sociali
31
L’albero della BFS da A
Autunno 2012
La rete
ESEMPIO
Autunno 2012
Struttura delle Reti Sociali
Numero di
cammini
minimi da A
Flusso
sull’arco
32

L’algoritmo richiede di ricalcolare ad ogni passo la
betweenness di tutti gli archi

Non scala per reti di grandi dimensioni
Approcci alternativi
Approssimazione della betweenness
 Utilizzo di algoritmi alternativi di graph partitioning
basati sia su approccio agglomerativo che divisivo


Struttura delle Reti Sociali

Autunno 2012
EFFICIENZA DELL’ALGORITMO DI GIRMANNEWMAN
E’ un argomento di ricerca attiva in questo
momento
33