Negativ binomialfordeling vs binomialfordeling

Spørgsmål:

alily

2015-10-08 15:53:58 UTC

view on stackexchange narkive permalink

Hvad er forskellen mellem den negative binomefordeling og den binomefordeling?

Jeg prøvede at læse online, og jeg fandt ud af, at den negative binomefordeling bruges, når datapunkter er diskrete, men jeg tror, selv binomial distribution kan bruges til diskrete datapunkter.

De er * begge * diskrete.

Enkel illustration: Du sælger slik fra dør til dør.Ved hver dør, du banker på, har du sandsynlighed 1/4 for at sælge 1 slikbar og sandsynlighed 3/4 eller sælge 0 slikbarer.Din sandsynlighed for at sælge n barer, hvis du banker på 50 døre, er en binomialfordeling i n.Din sandsynlighed for at skulle banke på m-døren for at sælge 30 søjler er en negativ binomialfordeling i m.Bemærk, at førstnævnte afskærer ved 50, fordi du ikke kan sælge mere end 50 søjler, mens sidstnævnte har en hale ved uendelig, fordi du bare kunne have forfærdeligt held den dag og aldrig sælge den 30. søjle.

Tre svar:

Jelsema

2015-10-08 17:22:40 UTC

view on stackexchange narkive permalink

Forskellen er, hvad vi er interesseret i. Begge distributioner er bygget fra uafhængige Bernoulli-forsøg med fast sandsynlighed for succes, p.

Med binomialfordelingen er den tilfældige variabel X er antallet af succeser, der er observeret i n forsøg. Fordi der er et fast antal forsøg, er de mulige værdier for X 0, 1, ..., n.

Med den negative binomial fordeling, er den tilfældige variabel Y antallet af forsøg indtil observeret r th succes ses. I dette tilfælde fortsætter vi med at øge antallet af forsøg, indtil vi når r succeser. De mulige værdier for Y er r , r + 1 , r + 2 , ... uden øvre grænse. Negativ binomial kan også defineres i form af antallet af fejl indtil r th succes, i stedet for antallet af forsøg indtil r th succes. Wikipedia definerer negativ binomialfordeling på denne måde.

Så for at opsummere:

Binomial :

Fast antal forsøg ( n )
Fast sandsynlighed for succes ( p )
Tilfældig variabel er X = Antal succeser.
Mulige værdier er 0 ≤ X ≤ n

Negativ binomial :

Fast antal succeser ( r )
Fast sandsynlighed for succes ( p )
Tilfældig variabel er Y = antal forsøg indtil r th succes.
Mulige værdier er r ≤ Y

Tak til Ben Bolker for at minde mig om at nævne støtten fra de to distributioner. Han besvarede et beslægtet spørgsmål her.

mere diskussion af NB her: http://stats.stackexchange.com/questions/6728/understanding-the-parameters-inside-the-negative-binomial-distribution/6729#6729.Det kan være værd at bemærke, at binomiale svar er afgrænset [0, N], NB-svar er ubegrænsede [0, ...]

Godt punkt, jeg har opdateret mit svar for at inkludere dette.

tak jelsema for detaljeret svar, jeg kunne forstå det bedre nu

Faktisk definerer Wikipedia det som "antallet af succeser, før et bestemt antal fejl (betegnet r) opstår."

@NoName Længere nede i artiklen er der to alternative formuleringer af den negative binomialfordeling, det var det, jeg henviste til.

Aksakal

2015-10-08 17:44:39 UTC

view on stackexchange narkive permalink

Negativ binomialfordeling, på trods af tilsyneladende åbenbar relation til binomial, er faktisk bedre sammenlignet med Poisson-fordelingen. Alle tre er diskrete, btw.

I praktiske anvendelser er NB et alternativ til Poisson, når man observerer spredningen (varians) højere end forventet af Poisson. Poisson er det første valg, du skal overveje, når du håndterer tælledata, f.eks. et årligt antal dødsfald i bilulykker i en lille by. Poissonfordelingens både middelværdi og varians er defineret af en parameter - en forekomst, normalt betegnet som $ \ lambda $. Så længe du estimerede $ \ lambda $, følger dit gennemsnit og varians. Faktisk skal middelværdien være lig med varians.

Hvis dine data antyder, at variansen er større end gennemsnittet (overdispersion), udelukker dette Poisson, så ville Negativ binomial være en næste fordeling at se på . Den har mere end en parameter, så dens varians kan være større end gennemsnittet.

Forholdet mellem NB og binomial kommer fra den underliggende proces, som det blev beskrevet i @ Jelsemas svar. Processen er relateret, så distributionerne er også, men som jeg forklarede her er linket til Poisson-distribution tættere på praktiske anvendelser.

UPDATE: Et andet aspekt er parametriseringen. Binomialfordeling har to parametre: p og n. Dets bona fide domæne er 0 til n. I og med at det ikke kun er diskret, men også defineret på et begrænset antal tal.

I modsætning hertil defineres både Poisson og NB på et uendeligt sæt ikke-negative heltal. Poisson har en parameter $ \ lambda $, mens NB har to: p og r. Bemærk, at disse to ikke har parameter $ n $. Således er det en måde at se, hvordan NB og Poisson er forbundet.

Jeg forstår ikke, hvad du mener med "bedre sammenlignet med Poisson-distributionen."Det originale spørgsmål siger ikke, hvilken slags modellering der ønskes.Det betyder ikke engang, at man overhovedet er interesseret i modellering.

@heropup, OP er tydeligvis interesseret i applikationer og sammenligner direkte NB med Binomial.Derfor handler mit svar om denne sammenligning, og denne sammenligning med Poisson er mere relevant i typiske applikationer.

Bahgat Nassour

2015-10-08 17:46:32 UTC

view on stackexchange narkive permalink

De er begge diskrete og repræsenterer tællinger, når du prøver.

Binomialfordeling repræsenterer antallet af succeser i et eksperiment, hvor antallet af tegninger er fastlagt på forhånd, antag for eksempel, at der er valgt tre emner tilfældigt fra en fremstillingsproces, og hver vare inspiceres og klassificeres defekt, $ D $ eller ikke-defekt, $ N $, ser vi, at prøveområdet i dette tilfælde er $ S = (DDD, DDN, DND, DNN, NDD, NDN, NND, NNN) $.

Da Negativ Binomial repræsenterer antallet af fejl, indtil du tegner et bestemt antal succeser. Overvej det samme eksempel, og antag, at eksperimentet er at prøve prøver tilfældigt, indtil en defekt vare observeres. Derefter er prøveområdet for denne sag $ S = (D, ND, NND, NNND, ...) $.

Så Binomial tæller succeser i et fast antal forsøg, mens Negativ binomialtælling mislykkes indtil et fast antal succeser, men for begge tegner vi med udskiftning, hvilket betyder, at hver prøve har en fast sandsynlighed $ p $ for succes.

ⓘ

Denne spørgsmål og svar blev automatisk oversat fra det engelske sprog.Det originale indhold er tilgængeligt på stackexchange, som vi takker for den cc by-sa 3.0-licens, den distribueres under.

om - legalese