Log-logistisk distribusjon - Log-logistic distribution

Logglogistisk
Sannsynlighets tetthetsfunksjon
Loglogisticpdf.svg
verdier av som vist i forklaringen
Kumulativ distribusjons funksjon
Loglogisticcdf.svg
verdier av som vist i forklaringen
Parametere skala form
Brukerstøtte
PDF
CDF
Mener
hvis , ellers udefinert
Median
Modus
hvis , 0 ellers
Forskjell Se hovedtekst
MGF hvor er Beta-funksjonen .
CF hvor er Beta-funksjonen .

I sannsynlighet og statistikk er den loglogistiske fordelingen (kjent som Fisk-fordelingen i økonomi ) en kontinuerlig sannsynlighetsfordeling for en ikke-negativ tilfeldig variabel . Den brukes i overlevelsesanalyse som en parametrisk modell for hendelser hvis hastighet øker innledningsvis og avtar senere, som for eksempel dødelighet fra kreft etter diagnose eller behandling. Det har også blitt brukt i hydrologi for å modellere strømning og nedbør , i økonomi som en enkel modell for fordeling av formue eller inntekt , og i nettverk for å modellere overføringstidene for data med tanke på både nettverket og programvaren.

Den loglogistiske fordelingen er sannsynlighetsfordelingen til en tilfeldig variabel hvis logaritme har en logistisk fordeling . Den har samme form som lognormalfordelingen, men har tyngre haler . I motsetning til log-normal, kan den kumulative fordelingsfunksjonen skrives i lukket form .

Karakterisering

Distribusjonen i bruk er flere. Den som vises her gir rimelig tolkbare parametere og en enkel form for den kumulative fordelingsfunksjonen . Parameteren er en skalaparameter og er også medianen for fordelingen. Parameteren er en formparameter . Distribusjonen er unimodal når og dens spredning avtar når den øker.

Den kumulative fordelingsfunksjonen er

der , ,

Den sannsynlighetstetthetsfunksjonen er

Alternativ parameterisering

En alternativ parametrisering er gitt av paret i analogi med den logistiske fordelingen:

Eiendommer

Øyeblikk

Det råe øyeblikket eksisterer bare når det er gitt av

hvor B er beta-funksjonen . Uttrykk for gjennomsnittet , varians , skjevhet og kurtose kan utledes av dette. Å skrive for enkelhets skyld er middelverdien

og avviket er

Eksplisitte uttrykk for skjevhet og kurtose er lange. Som en tendens til uendelig gjennomsnittet har en tendens til , har variansen og skjevheten en tendens til null, og overflødig kurtose har en tendens til 6/5 (se også relaterte distribusjoner nedenfor).

Kvantiler

Den quantile funksjon (invers kumulativ fordelingsfunksjon) er:

Det følger at medianen er , den nedre kvartilen er og den øvre kvartilen er .

applikasjoner

Farefunksjon . verdier av som vist i forklaringen

Overlevelsesanalyse

Den loglogistiske fordelingen gir en parametrisk modell for overlevelsesanalyse . I motsetning til den mer brukte Weibull-fordelingen , kan den ha en ikke- monoton farefunksjon : når farefunksjonen er unimodal (når  ≤ 1, reduseres faren monotont). Det faktum at den kumulative fordelingsfunksjonen kan skrives i lukket form er spesielt nyttig for analyse av overlevelsesdata med sensurering . Den loglogistiske fordelingen kan brukes som grunnlag for en akselerert feiltidsmodell ved å tillate forskjell mellom grupper, eller mer generelt ved å introdusere kovariater som påvirker, men ikke ved modellering som en lineær funksjon av kovariatene.

Den overlevelsesfunksjonen er

og slik at fare funksjon er

Den log-logistiske fordelingen med formparameter er den marginale fordelingen av mellomtider i en geometrisk distribuert telleprosess .

Hydrologi

Montert kumulativ logglogistisk fordeling til maksimalt en dags oktober nedbør ved bruk av CumFreq , se også Distribusjonstilpasning

Den loglogistiske fordelingen har blitt brukt i hydrologi for modellering av strømningshastigheter og nedbør.

Ekstreme verdier som maksimal nedbør på en dag og utslipp av elver per måned eller per år følger ofte en lognormalfordeling . Logg-normalfordelingen trenger imidlertid en numerisk tilnærming. Ettersom den log-logistiske fordelingen, som kan løses analytisk, ligner log-normalfordelingen, kan den brukes i stedet.

Det blå bildet illustrerer et eksempel på å tilpasse den loglogistiske fordelingen til rangert maksimalt en dags oktobernedbør, og det viser 90% konfidensbelte basert på binomialfordelingen . Nedbørsdataene er representert av plottposisjonen r / ( n +1) som en del av den kumulative frekvensanalysen .

Økonomi

Logglogistikken har blitt brukt som en enkel modell for fordeling av formue eller inntekt i økonomi , der den er kjent som Fisk-fordelingen. Dens Gini-koeffisient er .

Utledning av Gini-koeffisient

Gini-koeffisienten for en kontinuerlig sannsynlighetsfordeling tar form:

hvor er CDF for distribusjonen og er den forventede verdien. For den loglogistiske fordelingen blir formelen for Gini-koeffisienten:

Definisjon av substitusjon fører til den enklere ligningen:

Og å gjøre erstatningen forenkler Gini-koeffisientformelen ytterligere til:

Den integrerte komponenten tilsvarer standard beta-funksjon . Betafunksjonen kan også skrives som:

hvor er gammafunksjonen . Ved hjelp av egenskapene til gammafunksjonen kan det vises at:

Fra Eulers refleksjonsformel kan uttrykket forenkles ytterligere:

Til slutt kan vi konkludere med at Gini-koeffisienten for den loglogistiske fordelingen .

Nettverk

Logglogistikken har blitt brukt som modell for den tidsperioden som begynner når noen data etterlater et programvarebrukerprogram på en datamaskin og svaret mottas av samme applikasjon etter å ha gått gjennom og blitt behandlet av andre datamaskiner, applikasjoner og nettverk. segmenter, de fleste eller alle uten harde sanntidsgarantier (for eksempel når et program viser data som kommer fra en ekstern sensor koblet til Internett). Det har vist seg å være en mer nøyaktig sannsynlighetsmodell for det enn log-normalfordelingen eller andre, så lenge brå regimendringer i sekvensene av disse tider blir riktig oppdaget.

Relaterte distribusjoner

  • Hvis da
  • ( Dagum distribusjon ).
  • ( Distribusjon av Singh – Maddala ).
  • ( Beta primærfordeling ).
  • Hvis X har en log-logistisk fordeling med skalaparameter og formparameter, har Y  = log ( X ) en logistisk fordeling med plasseringsparameter og skalaparameter
  • Når formparameteren til den loglogistiske fordelingen øker, ligner dens form i økende grad den som en (veldig smal) logistisk fordeling . Uformelt:
  • Den loglogistiske fordelingen med formparameter og skalaparameter er den samme som den generaliserte Pareto-distribusjonen med plasseringsparameter , formparameter og skalaparameter
  • Tillegg av en annen parameter (en skiftparameter) resulterer formelt i en forskjøvet log-logistisk fordeling , men dette blir vanligvis vurdert i en annen parameterisering slik at fordelingen kan begrenses over eller begrenses nedenfor.

Generaliseringer

Flere forskjellige distribusjoner blir noen ganger referert til som generalisert log-logistisk distribusjon , da de inneholder log-logistikken som et spesielt tilfelle. Disse inkluderer Burr Type XII-distribusjonen (også kjent som Singh – Maddala-distribusjonen ) og Dagum-distribusjonen , som begge inneholder en andre formparameter. Begge er i sin tur spesielle tilfeller av den enda mer generelle generaliserte beta-distribusjonen av den andre typen . En annen mer grei generalisering av log-logistikken er den forskyvede log-logistiske fordelingen .

En annen generalisert log-logistisk fordeling er log-transformerte av Metalog fordeling , i hvilken effekt serie utvidelser i form av substitueres for logistikkfordelingsparametere og . Den resulterende log-metalog-fordelingen er meget formfleksibel , har enkel lukket form PDF og kvantilfunksjon , kan være tilpasset til data med lineære minste kvadrater, og antar at loglogistikkfordelingen er spesiell sak.

Se også

Referanser