Avhengighetsnettverk - Dependency network

Den avhengigheten nettverk tilnærmingen gir et systemnivå analyse av aktiviteten og topologien av rettet nettverk . Tilnærmingen trekker ut kausale topologiske forhold mellom nettverkets noder (når nettverksstrukturen analyseres), og gir et viktig skritt mot slutning av årsakssammenheng mellom nettverksnodene (ved analyse av nettverksaktiviteten). Denne metoden er opprinnelig introdusert for studier av finansielle data, den er utvidet og anvendt på andre systemer, for eksempel immunsystemet og semantiske nettverk .

Når det gjelder nettverksaktivitet, er analysen basert på delvise korrelasjoner , som blir stadig mer utbredt for å undersøke komplekse systemer . I enkle ord er den delvise (eller gjenværende) korrelasjonen et mål på effekten (eller bidraget) av en gitt node, si j , på korrelasjonene mellom et annet par noder, si i og k . Ved å bruke dette konseptet blir avhengigheten til en node på en annen node beregnet for hele nettverket. Dette resulterer i en rettet vektet adjacensmatrise for et fullt tilkoblet nettverk. Når tilknytningsmatrisen er konstruert, kan forskjellige algoritmer brukes til å konstruere nettverket, for eksempel et terskelnettverk, Minimal Spanning Tree (MST) , Planar Maximally Filtered Graph (PMFG) og andre.

Avhengighetsnettverk av finansielle data, for 300 av S & P500 -aksjene, handlet mellom 2001–2003. Aksjer er gruppert etter økonomiske sektorer, og pilen peker i retning av innflytelse. Navet i nettverket, den mest påvirkende sektoren, er finanssektoren. Reproduksjon fra Kenett et al., PLoS ONE 5 (12), e15032 (2010)

Betydning

Det delvise korrelasjonsbaserte avhengighetsnettverket er en klasse av korrelasjonsnettverk som er i stand til å avdekke skjulte forhold mellom nodene.

Denne originale metodikken ble først presentert i slutten av 2010, publisert i PLoS ONE . De avdekket kvantitativt skjult informasjon om den underliggende strukturen i det amerikanske aksjemarkedet , informasjon som ikke var til stede i standard korrelasjonsnettverk . Et av hovedresultatene av dette arbeidet er at strukturen i nettverket i den undersøkte tidsperioden (2001–2003) domineres av selskaper som tilhører finanssektoren , som er knutepunkter i avhengighetsnettverket. Dermed kunne de for første gang kvantitativt vise avhengighetsforholdet mellom de forskjellige økonomiske sektorene . Etter dette arbeidet har metodikken for avhengighetsnettverk blitt brukt på studiet av immunsystemet og semantiske nettverk . Som sådan er denne metoden anvendelig på ethvert komplekst system .

Avhengighetsnettverk av spesifikk antistoffaktivitet, målt for en gruppe mødre. Panel (a) presenterer avhengighetsnettverket, og panel (b) standard korrelasjonsnettverk. Reproduksjon fra Madi et al., Chaos 21, 016109 (2011)

Eksempel på avhengighetsnettverk av foreninger, konstruert fra et fullt semantisk nettverk. Reproduksjon fra Kenett et al., PLoS ONE 6 (8): e23912 (2011)

Oversikt

For å være mer spesifikk, er de delvise korrelasjonene til paret, gitt j korrelasjonene mellom dem etter riktig subtraksjon av korrelasjonene mellom i og j og mellom k og j . Definert på denne måten gir forskjellen mellom korrelasjonene og de delvise korrelasjonene et mål på innflytelsen fra node j på korrelasjonen . Derfor definerer vi påvirkning av node j på node i , eller avhengigheten til node i på node j - D ( i , j ), til å være summen av innflytelsen fra node j på korrelasjonene til node i med alle andre noder .

Når det gjelder nettverkstopologi, er analysen basert på effekten av nodesletting på de korteste banene mellom nettverksnodene. Mer spesifikt definerer vi påvirkningen av node j på hvert par noder (i, k) til å være invers av den topologiske avstanden mellom disse nodene i nærvær av j minus den inverse avstanden mellom dem i fravær av node j . Deretter definerer vi påvirkningen av noden j på noden i , eller avhengigheten til noden i på noden j - D ( i , j ), til å være summen av påvirkningen fra noden j på avstandene mellom noden i med alle andre noder k .

Aktivitetsavhengighetsnettverk

Node-node-korrelasjonene

Node-node-korrelasjonene kan beregnes etter Pearsons formel :

{\ displaystyle C_ {i, j} = {\ frac {\ left \ langle (X_ {i} (n)-\ mu _ {i}) (X_ {j} (n)-\ mu _ {j}) \ right \ rangle} {\ sigma _ {i} \ sigma _ {j}}}}

Hvor og er aktiviteten til nodene i og j for emnet n, står μ for gjennomsnittet, og sigma STD for dynamikkprofilene til nodene i og j . Vær oppmerksom på at node-node-korrelasjonene (eller for enkelhets skyld nodekorrelasjonene) for alle par av noder definerer en symmetrisk korrelasjonsmatrise hvis element er korrelasjonen mellom nodene i og j . ${\ displaystyle X_ {i} (n)}$ ${\ displaystyle X_ {j} (n)}$ ${\ displaystyle (i, j)}$

Delvise korrelasjoner

Deretter bruker vi de resulterende nodekorrelasjonene for å beregne de delvise korrelasjonene. Den første orden delvis korrelasjonskoeffisient er et statistisk mål som indikerer hvordan en tredje variabel påvirker korrelasjonen mellom to andre variabler. Den delvise korrelasjonen mellom noder i og k med hensyn til en tredje node er definert som: ${\ displaystyle j-PC (i, k \ mid j)}$

{\ displaystyle PC (i, k \ mid j) = {\ frac {C (i, k) -C (i, j) C (k, j)} {\ sqrt {[1-C^{2} ( i, j)] [1-C^{2} (k, j)]}}}}}

hvor og er nodekorrelasjonene definert ovenfor. ${\ displaystyle C (i, j), C (i, k)}$ ${\ displaystyle C (j, k)}$

Korrelasjonspåvirkning og korrelasjonsavhengighet

Den relative effekten av korrelasjonene og av noden j på korrelasjonen C ( i , k ) er gitt av: ${\ displaystyle C (i, j)}$ ${\ displaystyle C (j, k)}$

{\ displaystyle d (i, k \ mid j) \ equiv C (i, k) -PC (i, k | j)}

Dette unngår det trivielle tilfellet der node j ser ut til å påvirke korrelasjonen sterkt , hovedsakelig fordi og har små verdier. Vi merker oss at denne mengden kan ses enten som korrelasjonsavhengigheten til C ( i , k ) på node j , (begrepet som brukes her) eller som korrelasjonspåvirkning av node j på korrelasjonen C ( i , k ). ${\ displaystyle C (i, k)}$ ${\ displaystyle C (i, j), C (i, k)}$ ${\ displaystyle C (j, k)}$

Nodeaktivitetsavhengigheter

Deretter definerer vi den totale innflytelsen fra node j på node i , eller avhengigheten D ( i , j ) til node i på node j til å være:

{\ displaystyle D (i, j) = {\ frac {1} {N-1}} \ sum _ {k \ neq j}^{N-1} d (i, k \ mid j)}

Som definert er D ( i , j ) et mål på gjennomsnittlig innflytelse fra node j på korrelasjonene C (i, k) over alle noder k som ikke er lik j . Nodeaktivitetsavhengighetene definerer en avhengighetsmatrise D hvis ( i , j ) element er avhengigheten til noden i på noden j . Det er viktig å merke seg at mens korrelasjonsmatrisen C er en symmetrisk matrise, er avhengighetsmatrisen D usymmetrisk - siden påvirkningen av noden j på noden i ikke er lik påvirkningen av noden i på noden j . Av denne grunn må noen av metodene som brukes i analysene av korrelasjonsmatrisen (f.eks. PCA) byttes ut eller er mindre effektive. Likevel er det andre metoder, som de som brukes her, som på riktig måte kan redegjøre for den ikke-symmetriske naturen til avhengighetsmatrisen. ${\ displaystyle D (i, j) \ neq D (j, i)}$

Strukturavhengighetsnettverk

Banens innflytelse og avstandsavhengighet: Den relative effekten av node j på den dirigerte banen - den korteste topologiske banen med hvert segment tilsvarer en avstand 1, mellom nodene i og k er gitt: ${\ displaystyle DP (i \ høyre pil k | j)}$

{\ displaystyle DP (i \ rightarrow k \ mid j) \ equiv {\ frac {1} {td (i \ rightarrow k \ mid j^{+})}}-{\ frac {1} {td (i \ høyre pil k \ mid j^{-})}}}}

hvor og er den korteste dirigerte topologiske banen fra node i til node k i henholdsvis nærvær og fravær av node j . ${\ displaystyle td (i \ rightarrow k | j^{+})}$ ${\ displaystyle td (i \ høyre pil k \ mid j^{-})}$

Node strukturelle avhengigheter

Deretter definerer vi den totale innflytelsen fra node j på node i , eller avhengigheten D ( i , j ) til node i på node j til å være:

${\ displaystyle D (i, j) = {\ frac {1} {N-1}} \ sum _ {k = 1}^{N-1} DP (i \ høyre pil k \ mid j)}$

Som definert er D ( i , j ) et mål på gjennomsnittlig påvirkning av node j på de dirigerte banene fra node i til alle andre noder k . Nodens strukturelle avhengigheter definerer en avhengighetsmatrise D hvis ( i , j ) element er avhengigheten til noden i på noden j , eller påvirkningen av noden j på noden i . Det er viktig å merke seg at avhengighetsmatrisen D er usymmetrisk - siden påvirkning av node j på node i ikke er lik påvirkning av node i på node j . ${\ displaystyle D (i, j) \ neq D (j, i)}$

Visualisering av avhengighetsnettverket

Avhengighetsmatrisen er den veide adjasensmatrisen, som representerer det fullt tilkoblede nettverket. Ulike algoritmer kan brukes for å filtrere det fullt tilkoblede nettverket for å få mest mulig meningsfull informasjon, for eksempel å bruke en terskelmetode eller forskjellige beskjæringsalgoritmer. En mye brukt metode for å konstruere informativ undergraf for et komplett nettverk er Minimum Spanning Tree (MST). En annen informativ undergraf, som beholder mer informasjon (i forhold til MST) er Planar Maximally Filtered Graph (PMFG) som brukes her. Begge metodene er basert på hierarkisk klynge, og de resulterende undergrafene inkluderer alle N- nodene i nettverket hvis kanter representerer de mest relevante assosiasjonskorrelasjonene. MST- undergrafen inneholder kanter uten sløyfer mens PMFG-undergrafen inneholder kanter. ${\ displaystyle (N-1)}$ ${\ displaystyle 3 (N-2)}$

Languages

In other projects