UNISA
Transcript
UNISA
STRUTTURA DELLE RETI SOCIALI COMPORTAMENTI LOCALI E FENOMENI GLOBALI Vincenzo Auletta Autunno 2012 COMPORTAMENTI LOCALI E FENOMENI GLOBALI Struttura delle Reti Sociali Le network sono uno strumento utilissimo per descrivere il rapporto tra i comportamenti locali dei singoli ed i fenomeni globali che si verificano in una popolazione Come l’informazione viaggia nella rete? Come diversi archi possono svolgere funzioni diverse nella diffusione delle infromazioni? Come in una rete sociale diversi nodi possono svolgere ruoli distinti e come fare a riconoscerli? Come questi processi condizionano l’evoluzione della rete nel tempo? 1 ESPERIMENTO DI GRANOVETTER (1970) Autunno 2012 Struttura delle Reti Sociali Granovetter per la sua tesi di dottorato intervistò numerose persone che avevano appena trovato lavoro per come erano venuti a conoscenza dell’offerta di lavoro Nella maggior parte dei casi da contatti personali Più spesso da conoscenti che da amici Conclusione sorprendente Gli amici dovrebbbero essere quelli che più ci tengono ad aiutare e fornire notizie utili Perché i conoscenti sono più utili nella ricerca di un nuovo lavoro? 2 TESI DI GRANOVETTER A livello locale L’amicizia può essere forte o debole A livello globale Struttura delle Reti Sociali Due diversi modi di vedere l’amicizia Autunno 2012 L’amicizia può legare due nodi vicini o lontani nella rete Spiegazione di Granovetter Le informazioni viaggiano sui link che collegano parti diverse della rete Questi link tendono a rappresentare amicizie deboli Teoria della “Strength of Weak Ties” 3 TRIADIC CLOSURE Autunno 2012 B Struttura delle Reti Sociali In una rete sociale se due nodi hanno un amico in comune hanno buone probabilità di diventare amici in futuro C A Motivazioni sociologiche I due nodi hanno maggiori occasioni di incontrarsi e frequentarsi Se hanno un amico comune tendono a fidarsi dell’amico e ad accettare l’altro L’amico comune tende a favorire la loro amicizia per non doversi dividere tra i due 4 COEFFICIENTE DI CLUSTERIZZAZIONE Se osserviamo l’evolversi di una rete sociale nel tempo noteremo la tendenza alla chiusura di tutti i triangoli Struttura delle Reti Sociali Autunno 2012 Coefficiente di clusterizzazione Probabilità che due nodi scelti a caso tra gli amici di un nodo siano amici tra loro Più è forte la triadic closure maggiore sarà il coefficiente di clusterizzazione Bearman e Moody hanno scoperto empiricamente che ragazze con basso coefficiente di clusterizzazione sono più propense al suicidi 5 FORZA DEL LEGAME Autunno 2012 Secondo Granovetter il legame interpersonale può essere di tue tipi strong: amicizia weak: conoscenza Proprietà locale Struttura delle Reti Sociali Proprietà della Strong Triadic Closure Ipotesi operativa di Granovetter Se A ha legami strong con B e C allora con alta probabilità c’è un’amcicizia tra B e C Può essere strong o weak SoW B S C S A 6 BRIDGE Un bridge è un arco che collega due componenti distinte della rete Proprietà globale della rete B C A D bridge F G E H Struttura delle Reti Sociali Autunno 2012 Un bridge è un arco che non appartiene ad un triangolo In una rete sociale i bridge sono rari 7 LOCAL BRIDGE Autunno 2012 Un local bridge è un arco che riduce la distanza tra una coppia di nodi Svolge funzione simile al bridge Proprietà globale della rete Lo span di un local bridge è la distanza tra i suoi estremi se togliessimo l’arco Maggiore lo span più importante il ruolo di coesione dell’arco N M O I L B C A D Span = 4 Struttura delle Reti Sociali local bridge F G E H 8 STRENGTH OF WEAK TIES Autunno 2012 A l.b. C • • • B • • • Struttura delle Reti Sociali Assumiamo la Strong Triadic Closure Se un nodo ha almeno due strong ties allora ogni local bridge a cui è adiacente è un weak tie Sia AB un local bridge AB e BC strong ties BC non può esistere perchè AB non può stare in un triangolo BC esiste per STC -- CONTRADDIZIONE Quindi AB non può essere uno strong tie Quindi Se la rete ha un numero sufficiente di strong ties allora ogni local bridge è un weak tie Le informazioni cruciali viaggiano sui weak tie Collega una proprietà globale (local bridge) ad un comportamento locale (strength of tie) 9 FORZA DEI LEGAMI IN DATA-SET REALI Per molti anni non si è potuto verificare le teorie di Granovetter su network di grandi dimensioni e in contesti realistici Oggi abbiamo dati per reti “who-talks-to-whom” di grandi dimensioni Mancanza di dati concreti Facebook, social networks, tabulati telefonici, email Onnela e al. 2007 Dati di un provider di telefonia cellulare che copriva il 20% della popolazione statunitense Periodo di osservazione 18 settimane Due utenti sono collegati se hanno scambiato almeno una telefonata in entrambe le direzioni La forza del legame è misurata dal numero di minuti di comunicazione Struttura delle Reti Sociali Autunno 2012 10 NEIGHBORHOOD OVERLAP Neighborhood overlap di A e B ( NO(A, B) ) N M O I L Struttura delle Reti Sociali NO(A, B) = #(vicini comuni ad A e B)/ #(vicini ad A o B) Se AB è un local bridge NO(A, B) = 0 Nodi con piccolo neighborhood overlap sono “quasi” dei local bridge. Autunno 2012 1/6 B 0 C F G E H 1/4 A D 11 Ad ogni arco è assegnato il suo percentile Conferma la connessione tra la forza dei legami (locale) e la neighborhood overlap (globale) Struttura delle Reti Sociali Archi ordinati in maniera decrescente per forza del legame Autunno 2012 RISULTATI EMPIRICI SU FORZA DEI LEGAMI E NEIGHBORHOOD OVERLAP 12 IPOTESI DI ONNELA ET AL. La rete è fatta da comunità densamente legate da legami forti collegate da legami deboli I legami deboli svolgono un ruolo fondamentale nel tenere unita la comunità Esperimento: Cancella gli archi uno alla volta in ordine decrescente di forza 1. Struttura delle Reti Sociali Autunno 2012 La dimensione della componente gigante diminuisce gradualmente Cancella gli archi uno alla volta in ordine crescente di forza 2. 1. La dimensione della componente gigante diminuisce molto più velocemente 13 FORZA DEI LEGAMI NEI SOCIAL NETWORKS L’utilizzo sempre più diffuso dei social networks come ha modificato il comportamento degli utenti? Numerosi esperimenti condotti su principali social networks (facebook, twitter) Gli utenti di un social network tendono ad avere molti più contatti ma con minor forza dei legami Molto diffuso il fenomeno del passive engagement Struttura delle Reti Sociali Autunno 2012 una persona ne segue un’altra attraverso le notifiche ma senza mantenere contatti diretti Le informazioni fluiscono molto più velocemente 14 RUOLO DEI NODI IN UNA SOCIAL NETWORK La discussione precedente ha riguardato gli archi della rete Archi diversi svolgono ruoli differenti E per i nodi? Possiamo individuare ruoli diversi dei nodi a seconda della loro posizione nella rete? Struttura delle Reti Sociali Autunno 2012 15 EMBEDDEDNESS E STRUCTURAL HOLES Embeddedness di un arco AB = #(vicini comuni ad A e B) È il numeratore della funzione di neighborhood overlap La fiducia tra i due nodi adiacenti cresce con l’embeddedness dell’arco che li unisce Se un nodo è adiacente ad archi con alta embeddedness ha più facilità di relazione e maggiore fiducia nei suoi vicini Uno structural hole indica l’assenza di connessioni tra due aree della rete Struttura delle Reti Sociali Un local bridge ha embeddedness nulla Autunno 2012 Tali buchi sono coperti dai local bridge Un nodo adiacente ad uno structural hole può avere dei vantaggi dalla sua posizione Controlla il passaggio delle informazioni Conosce le cose prima degli altri 16 UN ESEMPIO Autunno 2012 Struttura delle Reti Sociali A è circondato da archi con alta embeddedness È incluso in una comunità molto coesa B, C e D si trovano su uno structural hole Controllano tutte le interazioni tra le varie comunità 17 CENTRALITÀ DI UN NODO Diverse misure di centralità legate a aspetti diversi della rete Degree centrality Closeness centrality Betweenness centrality Eigenvector centrality Struttura delle Reti Sociali Misura il ruolo svolto dal nodo nella rete Autunno 2012 Definite in modo da fornire un valore in [0, 1] Misurano l’”importanza” del nodo 18 DEGREE CENTRALITY Degree centrality di z F 1/3 1/3 A 1/3 B Struttura delle Reti Sociali grado(z)/(n-1) Misura l’importanza di un nodo in base al numero dei suoi vicini Autunno 2012 1/2 1/3 1/2 C D E 19 G 1/3 CLOSENESS CENTRALITY Autunno 2012 Closeness centrality di z (n-1)/∑u≠zd(u,z) Inverso della distanza media Misura la velocità con cui un nodo viene raggiunto/raggiunge da tutti gli altri 6/15 B Struttura delle Reti Sociali F 6/15 6/15 A 6/11 3/5 6/11 C D E 20 G 6/15 ∑u≠zd(u,z) Pesa maggiormente in nodi vicini Per 1 tende alla dimensione della componente in cui si trova il nodo Per 0 tende al grado Struttura delle Reti Sociali Per far pesare di più i collegamenti con i nodi vicini si può definire la centrality usando un parametro di decadimento 0 < < 1 Autunno 2012 CLOSENESS CENTRALITY CON PARAMETRO DI DECADIMENTO 21 BETWEENESS CENTRALITY Betweenness centrality di z 0 A 0 B Struttura delle Reti Sociali 2 / (n-1)(n-2) ∑u≠v, z ≠ u,v Pz(u,v) / P(u,v) P(u,v) = # cammini minimi tra u e v Pz(u,v) = # cammini minimi tra u e v passanti per z Misura quanto il nodo z è cruciale per la comunicazione tra tutte le coppie di nodi Autunno 2012 F 0 8/15 9/15 C D 8/15 E 22 G 0 EIGENVECTOR CENTRALITY Misura l’importanza di un nodo in funzione dell’importanza dei suoi vicini Cosa vi ricorda? Cz(G) = ∑u≠z G u,z Cu(G) In forma matriciale C(G) = G C(G) C(G) è un autovettore per G e è l’autovalore corrispondente Scegliamo l’autovalore più grande che per le reti considerate è sempre nonnegativo Struttura delle Reti Sociali Autunno 2012 23 GRAPH PARTITIONING Dalla discussione precedente ricaviamo un’idea di struttura di una rete sociale Come possiamo individuare le aree fittamente connesse Identificare le comunità della rete è vitale per gli esperti di marketing Problema algoritmico non banale Struttura delle Reti Sociali Un insieme di comunità fittamente connesse legate insieme da legami occasionali Definizione volutamente informale Autunno 2012 Numerosi metodi euristici per il graph partitioning Metodi agglomerativi Si parte dai singoli e si cerca di aggregarli in gruppi Metodi divisivi Si parte dalla rete in generale e si cerca di dividerla in sottoreti connesse in modo sparso tra loro 24 UN ESEMPIO DI PARTIZIONAMENTO DI UNA Autunno 2012 RETE IN COMUNITÀ Struttura delle Reti Sociali 25 GRAPH PARTITIONING PER DIVISIONE Basta individuare i local bridge? No Autunno 2012 Struttura delle Reti Sociali Possibile soluzione Calcoliamo la betweenness degli archi Gli archi con alta betweenness sono quelli su cui passa la maggior parte dell’informazione 26 GRAPH PARTITIONING PER DIVISIONE Ricalcola la betweeness di ogni arco e torna a passo 1 2. 3. Se il grafo si divide in più componenti hai trovato le regioni in cui si divide il grafo Se una componente si divide in sottocomponenti queste sono le regioni annidate nella regione padre Procedi fin quando rimangono archi nel grafo Struttura delle Reti Sociali Trova gli archi con più alta betweeness e rimuovili dal grafo 1. Autunno 2012 Algoritmo di Girvan-Newman L’algoritmo può essere adattato per calcolare anche la betweenness dei nodi 27 ESEMPIO Autunno 2012 Struttura delle Reti Sociali 28 Dipende dal numero di cammini minimi tra ogni coppia di nodi Si può fare efficientemente? Idea Struttura delle Reti Sociali L’algoritmo di Girman-Newman ad ogni passo deve ricalcolare la betweenness di tutti gli archi rimanenti nel grafo Autunno 2012 CALCOLO DELLA BETWEENNESS DEGLI ARCHI Utilizziamo una BFS da ogni nodo u Calcoliamo come un’unità di flusso si distribuisce nella rete a partire da un nodo u 29 Algoritmo 1. Se il nodo v si trova al k-imo livello dell’albero i cammini minimi da u a v hanno lunghezza k e passano per i padri di v nell’albero Il numero dei cammini minimi per v è la somma del numero di cammini minimi per i suoi padri 3. Struttura delle Reti Sociali 2. A partire da ogni nodo u esegui una BFS e costruisci l’albero dei percorsi minimi Per ogni nodo v, calcola quanti cammini minimi ci sono da u a v Autunno 2012 ALGORITMO PER IL CALCOLO DELLA BETWEENNESS Determina quanto flusso attraversa ogni arco del grafo Bottom up Ad ogni nodo assegna un’unità di flusso più tutto quello che gli arriva dai figli Ogni nodo distribuisce equalmente il proprio flusso tra i padri 30 ESEMPIO Struttura delle Reti Sociali 31 L’albero della BFS da A Autunno 2012 La rete ESEMPIO Autunno 2012 Struttura delle Reti Sociali Numero di cammini minimi da A Flusso sull’arco 32 L’algoritmo richiede di ricalcolare ad ogni passo la betweenness di tutti gli archi Non scala per reti di grandi dimensioni Approcci alternativi Approssimazione della betweenness Utilizzo di algoritmi alternativi di graph partitioning basati sia su approccio agglomerativo che divisivo Struttura delle Reti Sociali Autunno 2012 EFFICIENZA DELL’ALGORITMO DI GIRMANNEWMAN E’ un argomento di ricerca attiva in questo momento 33