1 / 42

Bayesianische Statistik für Einsteiger Tutorial 54. Gmds-Jahrestagung Essen 2009 Jochem König und Reinhard Vonthein

Bayesianische Statistik für Einsteiger Tutorial 54. Gmds-Jahrestagung Essen 2009 Jochem König und Reinhard Vonthein Institut für Medizinische Biometrie, Epidemiologie und Informatik und IMBS Lübeck koenig@imbei.uni-mainz.de. Bayes-Inferenz allgemein und abstrakt.

britannia
Download Presentation

Bayesianische Statistik für Einsteiger Tutorial 54. Gmds-Jahrestagung Essen 2009 Jochem König und Reinhard Vonthein

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bayesianische Statistik für Einsteiger Tutorial 54. Gmds-Jahrestagung Essen 2009 Jochem König und Reinhard Vonthein Institut für Medizinische Biometrie, Epidemiologie und Informatik und IMBS Lübeck koenig@imbei.uni-mainz.de

  2. Bayes-Inferenzallgemein und abstrakt • Zu Daten X und Parameter q mit Likelihood • Kommt eine Prior p(q). • Dann erhält man daraus mit dem Satz von Bayes die Posterior • Der Nenner ist ‚konstant‘, d.h.nur von X, nicht von q abhängig.

  3. Einstichproben-Problem unter Normalverteilung • Nehme bekannte Varianz s2 an. • Die Dichte von ist • Prior

  4. Normales EinstichprobenproblemPosterior • Also

  5. Normales EinstichprobenproblemPosterior • Die normale Prior und die normale Likelihood machen eine normale Posterior. • Der a Posteriori-Erwartungswert ist ein Präzisionsgewichtetes Mittel aus a priori Erwartungswert und Stichprobenmittelwert.(Präzision:=1/Varianz) • Wenn Prior und Posterior aus derselben Familie sind heißen Likelihood und Prior konjugiert. • Die Parameter der Prior heißen Hyperparameter.

  6. Normales EinstichprobenproblemNichtinformative PriorDer Trost für die Objektivisten und die Unentschiedenen • Bisher allgemein • Nun: • Eine nichtnegative messbare Abbildung nach R heißt uneigentliche (improper) Dichte, wenn die Fläche darunter unendlich ist. • Diese Prior ist nicht informativ und uneigentlich • Dennoch ist die Posterior definiert und eigentlich

  7. Warum darf man uneigentliche Priors verwenden? • Nochmal der Satz von Bayes • Nur das Integral im Nenner muss endlich sein, damit diese Posterior eine Dichte wird. • Die Prior muss nur bis auf einen constanten Faktor angegeben werden, kann also eine beliebige nichtnegative messbare Funktion sein. • Das Verhältnis p(q1):p(q2) gibt an, welchen Parameterwert ich a priori für wahrscheinlicher halte. • heißt: Ich bin perfekt unentschieden.

  8. 2 Wermutstropfen 1 Nicht immer führt eine improper Prior auf eine proper Posterior. 2 Der Begriff ‚nicht-informativ‘ kann in einer Situation verschiedenen Priors angeheftet werden. • Eine sehr beliebte und fundierte nichtinformative Prior ist Jeoffry‘s Prior. • Sie führt auf maximale Verwandtschaft zu Maximum-Likelihood-Inferenz.

  9. Normales Einstichprobenproblem: Was kommt heraus? - Ergebnis der Bayes-Inferenz Die Posterior und Funktionale davon: • Posterior Mean • Posterior Mode • Posterior Median • 95%-credibility interval (credible interval) aus 2,5% und 97,5% -Quantil • 95%-HPD-Intervall, HPD=highest posterior density • Überschreitungswahrscheinlichkeitals „Bayes-P-Wert“ für einseitigen Test

  10. Normales Einstichprobenproblem: Was kommt heraus? - Ergebnis der Bayes-Inferenz Die Posterior und Funktionale davon: • Posterior Mean = Posterior Mode = Posterior Median = • 95%-credibility interval (credible interval) aus 2,5% und 97,5% -Quantil • = 95%-HPD-Intervall, • Überschreitungswahrscheinlichkeitals „Bayes-P-Wert“ für einseitigen Test

  11. Normales Einstichprobenproblem: Ergebnis Speziell für p(q)=1, dh s-2=0 Die Posterior und Funktionale davon: • Posterior Mean = Posterior Mode = Posterior Median = • 95%-credibility interval (credible interval) aus 2,5% und 97,5% -Quantil • = 95%-HPD-Intervall, • Überschreitungswahrscheinlichkeitals „Bayes-P-Wert“ für einseitigen Test

  12. Bayes-Methoden: Äquivalenzen Ein-Stichproben-Problem bekannte Varianz Punktschätzer, Konfidenzintervall und Test frequentistisch sind identisch mit den Bayesianischen Entsprechungen bei konstanter uneigentlicher Prior Methode Frequentistisch Bayesianisch , Modell Punktschätzer Konfidenzinterval p-Wert *

  13. Einstichproben-Problem unter Normalverteilung - Zwei Studien in Folge • Beginne mit Prior p(µ)=1 • Stichprobe 1 vom Umfang n1: • Macht Posterior • Das ist die Prior für Stichprobe 2 • Stichprobe 2 vom Umfang n2: • Macht Posterior • Bayes-Inferenz zeigt auf natürliche Weise den Zuwachs an Information an.

  14. 2. TeilSchätzung eines Anteils

  15. Schätzung eines Anteils • Binomialverteilung • Mit Zähldichte • Dazu konjugiert ist die Beta-Verteilung. • Man entdeckt sie, indem man nicht y sondern q als Zufallsgröße ansieht.

  16. Die Beta-Verteilung • Dichte

  17. Beta-Verteilung

  18. Mehr Beta

  19. Schätzung eines Anteils

  20. Schätzung eines AnteilsWelche Prior? • Asymptotisch alles gleich • Beta(0,0) ist gleichverteilung auf log(q/(1-q)) • Beta(0,0) führt für y=0,n auf uneigentliche Posterior! • Beta(.5,.5) ist Jeffreys Prior. (Siehe Carlin& Louis)

  21. Beispiel Y=2,n=5 Posterior Beta(a+y,b+n-y) = Beta(a+2,b+3)

  22. Schätzung eines AnteilsZusammenhang zu exaktem Konfidenzintervall • Exakte binomiale Konfidenzintervalle nach Pearson-Clopper für k Erfolge bei n Versuchen • Für die Prior Beta(0,1) ist die untere Grenze des credible intervals identisch mit der unteren Konfidenzintervallgrenze nach Pearson Clopper. • Für die Prior Beta(1,0) ist die obere Grenze des credible intervals identisch mit der oberen Konfidenzintervallgrenze nach Pearson Clopper.

  23. Ratenschätzung frequentistisch und Bayesianisch • Prior uniform auf [0,1] uniform auf Logit-Skala • Exakte 95% Konfidenzintervalle und ML-Schätzer • posterior Intervall und Median • posterior Mean • posterior Mode

  24. Teil 3. BeispielBayesianische Schäzung einer Prävalenz in Abwesenheit eines Goldstandards Results of serologic and stool testing for Strongyloides Infection on 162 Cambodian refugees arriving in Montreal, Canada, between July 1982 and February 1983

  25. Bayesianische Schäzung einer Prävalenz in Abwesenheit eines Goldstandards Results of serologic and stool testing for Strongyloides Infection on 162 Cambodian refugees arriving in Montreal, Canada, between July 1982 and February 1983

  26. Beispiel: Bayesianische Prävalenzschätzung in Abwesenheit eines Goldstandards • Prävalenz? • Stuhlprobe ist hochspezifisch. Also pr > 25%?

  27. Beispiel: Bayesianische Prävalenzschätzung in Abwesenheit eines Goldstandards: Das Modell • Bedingte Unabhängigkeit der Tests gegeben der wahre Zustand • Dann haben wir 5 Parameters (Prävalence, 2 Sensitivitäten, 2 Spezifitäten) • Und dazu 5 Binomialverteilungen, welche erklären, wie die Daten entstehen.

  28. Bayesianische Prävalenzschätzung in Abwesenheit eines Goldstandards„Prior-Elicitation“ durch Experten und Literatur

  29. Example: Bayesian estimation of disease prevalence in absence of a gold standard From: Joseph & al. 1995 Bayesian estimation of disease prevalence in absence of a gold standard. Am.J.Epidemiology 141, 263-272.

  30. Zauberei? • Die Daten sind vier Zahlen. • Es gibt 5 Parameter. • Dann müssen die Ergebnisse wesentlich von der Wahl der Priors abhängen! • Sensitivitätsanalysen sind angezeigt (Variation der Prior): • Lästig aber unerlässlich.

  31. Bayesianische Prävalenzschätzung in Abwesenheit eines Goldstandards:Wozu Bayes? • Man könnte doch auch Prävalenzen für eine Reihe von plausiblen Sensitivitäten und Spezifitäten herleiten. • Bayes-Analyse gibt einen formalen Rahmen • Man ist veranlasst die Unsicherheit über unbekannte Parameter zu diskutieren und zu quantifizieren. • Dafür erhält man eine Synthese von getroffenen Annahmen und beobachteten Daten.

  32. Ausblick: Gemischte Modelle • Das lineare fixed effects Modell mit flacher Prior für die Koeffizienten und flacher Prior für log(s) ist nahezu identisch zur Kleinste-Quadrate Regression. • Erweiterung um Zufallseffekte in WinBUGS sehr einfach. • Siehe Beispiel 1 ‘Rats’ aus dem Beispiele-Manual • Im Gegensatz zu ML und REML enthalten die a posteriori Standardfehler der Koeffizienten auch die Unsicherheit über die Zufallseffektvarianzparameter.

  33. Regressoren Zentrieren • WinBUGS ist nicht translationsinvariant • Es wird dringend empfohlen, alle stetigen Regressoren zu zentrieren: • Ersetze xi durch xi-mean • Code-Beispiel • mue[i]<-alpha+beta*(x[i]-3.5) • Die Mittelwerte am besten außerhalb Winbugs bestimmen und als Konstante einfügen. Dann geht es schneller. • Nicht Zentrieren kann die Konvergenz gefährden.

  34. Ausblicke

  35. Fields for Bayesian Analysis in Epidemiology • Hierarchical models (syn: multilevel models) • Spatial epidemiology • Missing values • Meta analysis • Bayesian sensitivity analysis • Errors in variables (exposures measured with uncertainty) • Hybrid designs: inference from several data sources (internal validation study, repeated measurements) • Risk analysis and health technology assessment.

  36. Fehlende Werte • Die rationaleren Konzepte haben alle eine Bayesianische Komponente. • WinBUGS versteht den Wert NA = not available. • Die Ergebnisse sind valide unter “non-informative missingness”. • Man kann informative missingness modellieren, indem man Vektoren mit missingness-Indikatoren den Daten beifügt und eine Modell dazu spezifiziert. • Die Parameter für das Missingness Modell sind in der Regel sehr schlecht schätzbar und sollten daher • Im Rahmen einer Sensitivitätsanalyse fest gesetzt werden, oder • ((Mit stark informativen Priors belegt werden )) • Siehe z.B. Carpenter Pocock, Stat. Med.

  37. Die AG Bayes-Methodik • der Deutschen Region der Internationalen Biometrischen Gesellschaft • www.imbei.uni-mainz.de/bayes • Abstracts und Slides aller AG-Tagungen • Eine Literatur-Datenbank zu MCMC • Links zu Bayes-Sites.

  38. Bayes-Analyse ohne WinBUGS? Ja. • New procedures in SAS (see references below) • INLA = Approximate Bayesian inference for latent Gaussian models by using integrated nested Laplace Approximations (havard rue) • BayesX (free from the statistics website at LMU München) • GeoBUGS • R2WinBUGS etc.

  39. Ankündigung und Call for Papers Gemeinsame Arbeitstagung der Arbeitsgruppen Bayes-Methodik, Ökologie und Umwelt und Räumliche Statistik 03. bis 05. 12. 2009 an der Universität Lübeck Tutorium von Håvard Rue, Trondheim:Gaussian Markov Random Fields and Bayesian integration (INLA).

  40. Gemeinsame Arbeitstagung, Lübeck,3.-5.12.2009 • Vorträge aus dem gemeinsamen Interessenbereich der drei Arbeitsgruppen. • Themenbereiche sind: • Hierarchische Modelle, • Kosten-Nutzen-Analyse und Entscheidungsfindung, • Geostatistik, Disease Mapping, Raum-zeitliche Modelle, räumliche Modelle für Waldlandschaften • statistische Analyse von Krebsregister- und Surveillance-Daten, sowie • freie Themen. • Nähere Informationen www.imbei.uni-mainz.de/bayes • Anmeldungen und Kurzfassungen (max. 1 DIN A4-Seite, 12pt) von Vorträgen bitte bis 15. 09. 2009 zur Begutachtung an einen der folgenden Ansprechpartner: • Dr. Jochem König, Inst. für Med. Biometrie, Epidemiologie und Informatik, Johannes Gutenberg-Univ. Mainz, 55131 Mainz, Tel. 06131-17-3121, Fax -2968, koenig@imbei.uni-mainz.de,

  41. Literatur • James O. Berger: Statistical Decision Theory and Bayesian Analysis, 2nd Edition. Springer 1985 • Gelman, A., Carlin, J. B., Stern, H. S., and Rubin, D. B. (2004), Bayesian Data Analysis, 3rd ed.London: Chapman & Hall. • Gelman et. al http://www.stat.columbia.edu/~gelman/book/ • B P Carlin & T A Louis (2000). Bayes and Empirical Bayes Methods for Data Analysis. Chapman & Hall/CRC. • J M Bernardo & A F M Amith (2000). Bayesian Theory. Wiley. • http://support.sas.com/documentation/cdl/en/statugbayesian/61755/PDF/default/statugbayesian.pdf • Und Literatur dort.

  42. Literatur – etwas länger • Greenland S. Bayesian perspectives for epidemiological research: I. Foundations and basic methods. Int. J. Epi 2006 • Greenland S. Bayesian perspectives for epidemiological research: II.Regression analysis. Int. J. Epi 2007 • James O. Berger: Statistical Decision Theory and Bayesian Analysis, 2nd Edition. Springer 1985 • Gelman, A., Carlin, J. B., Stern, H. S., and Rubin, D. B. (2004), Bayesian Data Analysis, 3rd ed.London: Chapman & Hall. • Gelman et. al http://www.stat.columbia.edu/~gelman/book/ • B P Carlin & T A Louis (2000). Bayes and Empirical Bayes Methods for Data Analysis. Chapman & Hall/CRC. • J M Bernardo & A F M Amith (2000). Bayesian Theory. Wiley. • http://support.sas.com/documentation/cdl/en/statugbayesian/61755/PDF/default/statugbayesian.pdf and references there. • Approximate Bayesian inference for latent Gaussian models by using integrated nested Laplace Approximations. JRSS B 71, Part 2, pp. 1–35 www.math.ntnu.no/~hrue/RueOct2008.pdf

More Related