Spørgsmål:
Eksempler på bayesisk og hyppig tilgang, der giver forskellige svar
user541686
2012-11-13 15:13:38 UTC
view on stackexchange narkive permalink

Bemærk: Jeg er opmærksom på filosofiske forskelle mellem Bayesiansk og hyppigistisk statistik.

For eksempel "hvad er sandsynligheden for, at mønten på tabellen er hoveder "giver ikke mening i hyppige statistikker, da den enten har landet hoveder eller haler - der er ikke noget sandsynligt ved det. Så spørgsmålet har intet svar hyppigt.

Men sådan en forskel er specifikt ikke den slags forskel, jeg spørger om.

Jeg vil snarere gerne vide, hvordan deres forudsigelser for velformede spørgsmål faktisk adskiller sig i den virkelige verden, eksklusive enhver teoretiske / filosofiske forskelle som eksemplet, jeg nævnte ovenfor.

Så med andre ord:

Hvad er et eksempel på et spørgsmål, der kan svares på begge hyppige og Bayesian statistik, hvis svar er forskelligt mellem de to?

(f.eks. svarer den ene måske "1/2" på et bestemt spørgsmål, og den anden svarer "2/3 ".)

Er der sådanne forskelle?

  • Hvis ja, hvad er nogle eksempler?

  • Hvis ikke, hvornår betyder det faktisk nogensinde en forskel om jeg bruger Bayesiske eller hyppige statistikker, når jeg løser et bestemt problem?
    Hvorfor ville jeg undgå den ene til fordel for den anden?

John Kruschke producerede lige to videoer, hvor han sammenligner Bayesianske og standardstatistiske metoder. Han har mange eksempler, hvor den bayesiske metode afviser, men standardmetoden ikke. Måske ikke nøjagtigt hvad du ledte efter, men alligevel ... http://youtu.be/YyohWpjl6KU og http://youtu.be/IhlSD-lIQ_Y.
Binomialfordelingen giver et andet eksempel, hvor hyppighed (sandsynlighedsbaseret) slutning og Bayesisk slutning i nogle tilfælde er forskellige. Profilsandsynligheden for parameteren $ N $ forfalder ikke til $ 0 $ som $ N \ rightarrow \ infty $ ([se] (http://stats.stackexchange.com/q/27911/10525)) for nogle prøver. Dette indebærer, at noget sandsynlighedsinterval har uendelig længde. På den anden side henfalder den marginale bageste fordeling af $ N $ altid til $ 0 $ som $ N \ rightarrow \ infty $ i betragtning af at den er integrerbar.
@Procrastinator: Tak, jeg kigger på de nævnte dias lige nu. Dette virker lidt mere intens end min matematiske baggrund, men forhåbentlig får jeg noget ud af det. :)
Du vil måske se Steens eksempel. Jeg forklarer det på min blog her: http://normaldeviate.wordpress.com/2012/12/08/flat-priors-in-flatland-stones-paradox/
@mbq: Bare undrende, hvorfor blev dette lavet community wiki?
Jeg stødte lige på dette enkle eksempel: [The Table Game] (ftp://selab.janelia.org/pub/publications/Eddy-ATG3/Eddy-ATG3-reprint.pdf) der viser, at de to foreslåede løsninger, Bayesian oghyppighed, er meget forskellige (og kun én er korrekt!).
Fem svar:
Dikran Marsupial
2012-11-13 16:01:50 UTC
view on stackexchange narkive permalink

Se mit spørgsmål her, hvor der nævnes et papir af Edwin Jaynes, der giver et eksempel på et korrekt konstrueret hyppighedskonfidensinterval, hvor der er tilstrækkelig information i stikprøven til sikkert at vide, at den sande værdi af statistikken ligger ingen steder i konfidensintervallet (og dermed er konfidensintervallet forskelligt fra det bayesiske troværdige interval).

Årsagen til dette er dog forskellen i definitionen af ​​et konfidensinterval og et troværdigt interval, hvilket igen er en direkte konsekvens af forskellen i hyppighed og Bayesianske definitioner af sandsynlighed. Hvis du beder en Bayesian om at producere et Bayesian-tillidsinterval (snarere end troværdigt), så formoder jeg, at der altid vil være en prior, hvor intervallerne vil være de samme, så forskellene er ned til valget af prior.

Hvorvidt hyppige eller bayesiske metoder er passende, afhænger af det spørgsmål, du vil stille, og i slutningen af ​​dagen er det forskellen i filosofier, der bestemmer svaret (forudsat at den krævede beregnings- og analytiske indsats ikke er en overvejelse) .

At være noget tunge i kinden, kan det hævdes, at en frekvens på lang sigt er en helt rimelig måde at bestemme den relative sandsynlighed for en proposition, i hvilket tilfælde hyppighed statistik er en lidt underlig delmængde af subjektiv Bayesianism - så ethvert spørgsmål, som en frekventist kan besvare en subjektivist, kan Bayesian også besvare på samme måde, eller på en anden måde, hvis de vælger forskellige priors. ; o)

Brugen af ​​"subjektiv Bayesian" er lidt af en selvsabotage ([se] (http://ba.stat.cmu.edu/journal/2006/vol01/issue03/christen.pdf)). Modellering generelt er fuld af subjektivisme, valget af en distribution til modellering af en prøve er også subjektivt. Selv valget af en test af godhed af pasform for at kontrollere, om en bestemt model er rimelig, er subjektiv.
Jeg er ikke rigtig enig i det, hvis nogen betragter "subjektiv" som perjorativ, er det deres fejl. Nogle gange når vi mener sandsynlighed, mener vi virkelig subjektiv personlig tro - jeg ser ingen grund til ikke at kalde det, at hvis det er det, der egentlig menes (vælger kun at acceptere langsigtede frekvenser, da definitionen af ​​sandsynlighed er et rent subjektivt valg).
+1 tak for linket, det er meget oplysende. Og også for noten om forskellen mellem tillid og troværdige intervaller også.
Christoph Hanck
2015-03-25 17:33:07 UTC
view on stackexchange narkive permalink

Dette eksempel er taget fra her. (Jeg tror endda, at jeg fik dette link fra SO, men jeg kan ikke finde det længere.)

En mønt er blevet kastet $ n = 14 $ gange og kommer op hoveder $ k = 10 $ gange. Hvis det skal kastes to gange mere, ville du satse på to hoveder? Antag, at du ikke får se resultatet af det første kast før det andet kast (og også uafhængigt betinget af $ \ theta $), så du ikke kan opdatere din mening om $ \ theta $ imellem de to kast.

Efter uafhængighed er $$ f (y_ {f, 1} = \ text {heads}, y_ {f, 2} = \ text {heads} | \ theta) = f (y_ {f, 1} = \ text {heads}) f (y_ {f, 2} = \ text {heads} | \ theta) = \ theta ^ 2. $$ Derefter gav den forudsigelige fordeling en $ \ text {Beta} (\ alpha_0, \ beta_0) $ - prior, bliver \ begin {eqnarray *} f (y_ {f, 1} = \ text {heads}, y_ {f, 2} = \ text {heads} | y) & = & \ int f (y_ {f, 1} = \ text {heads}, y_ {f, 2} = \ text {heads} | \ theta) \ pi (\ theta | y) d \ theta \ notag \\ & = & \ frac {\ Gamma \ left (\ alpha _ {0} + \ beta_ {0} + n \ right)} {\ Gamma \ left (\ alpha_ {0} + k \ right) \ Gamma \ left (\ beta_ { 0} + nk \ right)} \ int \ theta ^ 2 \ theta ^ {\ alpha _ {0} + k-1} \ left (1- \ theta \ right) ^ {\ beta _ {0} + nk- 1} d \ theta \ notag \\ & = & \ frac {\ Gamma \ left (\ alpha_ {0} + \ beta_ {0} + n \ right)} {\ Gamma \ left (\ alpha_ {0} + k \ højre) \ Gamma \ venstre (\ beta_ {0} + nk \ højre)} \ frac {\ Gamma \ venstre (\ alpha_ {0} + k + 2 \ højre) \ Gamma \ venstre (\ beta_ {0} + nk \ right)} {\ Gamma \ left (\ alpha_ {0} + \ beta_ {0} + n + 2 \ right)} \ notag \\ & = & \ frac {(\ alpha_ {0} + k) \ cdot (\ alpha_ {0} + k + 1)} {(\ alph a_ {0} + \ beta_ {0} + n) \ cdot (\ alpha_ {0} + \ beta_ {0} + n + 1)} \ end {eqnarray *} For en ensartet tidligere (en $ \ text {Beta } (1, 1) $ - prior), dette giver omtrent 0,485. Derfor ville du sandsynligvis ikke satse. Baseret på MLE 10/14 beregner du sandsynligheden for to hoveder på $ (10/14) ^ 2 \ ca. 51 $, således at væddemål giver mening.

+1 nøjagtigt den slags svar, jeg ledte efter, tak.
Der var faktisk en opdatering af indlægget, der henvises til i svaret ... Selvom han forlod indlægget, "i stedet for at bruge den ensartede fordeling som tidligere, kan vi være endnu mere agnostiske. I dette tilfælde kan vi bruge Beta (0,0) fordeling som tidligere. En sådan fordeling svarer til det tilfælde, hvor ethvert gennemsnit af fordelingen er lige sandsynlig. I dette tilfælde giver de to tilgange, Bayesian og hyppighed de samme resultater. "!!!Så vi har stadig brug for et eksempel for at besvare dette spørgsmål!Derfor +1 til nedenstående svar som det sande svar på dette spørgsmål.
@user1745038 Hvad er berettigelsen til en beta (0,0)?Denne distribution er ikke bare forkert, den defineres ikke.
phaneron
2012-11-13 21:09:26 UTC
view on stackexchange narkive permalink

Jeg mener, at dette papir giver en mere målrettet fornemmelse af afvejningerne i faktiske anvendelser mellem de to. En del af dette kan skyldes min præference for intervaller snarere end tests.

Gustafson, P. og Greenland, S. (2009). Interval Estimation for Messy Observational Data. Statistisk videnskab 24: 328-342.

Med hensyn til intervaller kan det være værd at huske på, at hyppige konfidensintervaller kræver / kræver ensartet dækning (nøjagtigt eller i det mindste meget større end x% for hver parameterværdi, der ikke har nul sandsynlighed), og hvis de ikke har det - er de ikke rigtig konfidensintervaller. (Nogle vil gå videre og sige, at de også skal udelukke relevante undergrupper, der ændrer dækningen.)

Bayesisk dækning defineres normalt ved at lempe den til "i gennemsnit dækning" i betragtning af den antagne tidligere viser sig at være nøjagtigt korrekt. Gustafson og Grønland (2009) kalder disse allmægtige priors og betragter fejlfarlige for at give en bedre vurdering.

+1 Jeg vidste aldrig om denne forskel i begrænsning, tak fordi du påpegede det.
Emil Friedman
2012-11-14 02:22:51 UTC
view on stackexchange narkive permalink

Hvis nogen skulle stille et spørgsmål, der både har et hyppigt og Bayesisk svar, formoder jeg, at en anden ville være i stand til at identificere en tvetydighed i spørgsmålet og dermed gøre det ikke "velformet".

Med andre ord, hvis du har brug for et hyppigt svar, skal du bruge hyppige metoder. Hvis du har brug for et Bayesian-svar, skal du bruge Bayesian-metoder. Hvis du ikke ved, hvad du har brug for, så har du muligvis ikke defineret spørgsmålet utvetydigt.

Men i den virkelige verden er der ofte flere forskellige måder at definere et problem eller stille et spørgsmål på. Nogle gange er det ikke klart, hvilken af ​​disse måder der foretrækkes. Dette er især almindeligt, når ens klient er statistisk naiv. Andre gange er et spørgsmål meget sværere at besvare end et andet. I disse tilfælde går man ofte nemmest, mens man prøver at sikre sig, at hans klienter er enige i præcis, hvilket spørgsmål han stiller, eller hvilket problem han løser.

Flounderer
2014-01-15 04:37:29 UTC
view on stackexchange narkive permalink

Jeg anbefaler at se på øvelse 3.15 i den frit tilgængelige lærebog Informationsteori, inferens og indlæringsalgoritmer af MacKay.

Når den spindes på kanten 250 gange, en Den belgiske mønt på en euro kom 140 gange op og haler 110. 'Det ser meget mistænkeligt ud for mig', sagde Barry Blight, en statistiklærer ved London School of Economics. 'Hvis mønten var upartisk, ville chancen for at få et resultat så ekstremt, som det ville være mindre end 7%'. Men giver disse data bevis for, at mønten er forudindtaget snarere end fair?

Eksemplet er udarbejdet i detaljer på s. 63-64 i lærebogen. Konklusionen er, at $ p $ -værdien er $ 0,07 $, men den Bayesiske tilgang giver forskellige niveauer af støtte til begge hypoteser afhængigt af den foregående. Dette spænder fra et anbefalet svar uden bevis for, at mønten er forudindtaget (når en flad prior bruges) til et svar på højst $ 6: 1 $ mod nulhypotesen om upartiskhed, i tilfælde af at der anvendes en kunstigt ekstrem prior .



Denne spørgsmål og svar blev automatisk oversat fra det engelske sprog.Det originale indhold er tilgængeligt på stackexchange, som vi takker for den cc by-sa 3.0-licens, den distribueres under.
Loading...