Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen.

Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion! (Artikel eintragen)

Importance Sampling (im Deutschen manchmal auch Stichprobenentnahme nach Wichtigkeit, oder Stichprobenziehung nach Wichtigkeit genannt) ist ein Begriff aus der Statistik, der die Technik zur Erzeugung von Stichproben anhand einer Wahrscheinlichkeitsverteilung beschreibt. Importance Sampling ist eine von mehreren Möglichkeiten zur Varianzreduktion, also zur Steigerung der Effizienz von Monte-Carlo-Simulationen.

Motivation

Monte-Carlo-Simulationen werden oft benutzt, um Erwartungswerte einer Funktion (hier mit bezeichnet

zu berechnen, wobei eine Wahrscheinlichkeit(sdichte) ist (z.b. proportional zum Boltzmann-Faktor). ist der Wert der Größe für die Realisierung . Die Summation (oder Integration) läuft dabei über den Ergebnisraum , (z. B. den Phasenraum der Teilchen im System). Da dieser Ergebnisraum im Allgemeinen sehr hochdimensional ist, kann die Summe bzw. das Integral im Allgemeinen nicht berechnet werden. Statt den wahren Erwartungswert zu berechnen, berechnet man einen Schätzer mithilfe einer Zufallsstichprobe S, die den Umfang hat. Für eine große Stichprobe nähert sich der Schätzer jeweils dem wahren Erwartungswert an:

Simple Sampling

Im einfachsten Fall (einfache Stichprobenentnahme, englisch simple sampling) werden aus dem Ergebnisraum gleichverteilt zufällig Zustände für die Stichprobe S ausgewählt. Dann ergibt sich für den geschätzten Mittelwert:

wobei die Summation über die zufälligen Realisierungen in der Stichprobe läuft. ist die ursprüngliche Wahrscheinlichkeit(sdichte) für die - durch Simple Sampling erzeugte - Realisierung . ist eine Funktionsauswertung.

Grundidee des Importance Sampling mit Beispiel

Der Standardansatz zur Approximation des Erwartungswertes einer Zufallsvariablen durch Monte-Carlo-Simulation besteht darin, Zufallszahlen als Realisierungen stochastisch unabhängiger und identisch verteilter Zufallsvariablen mit der Wahrscheinlichkeitsverteilung von zu erzeugen und dann den gesuchten Erwartungswert durch den Schätzwert

zu approximieren.

Beim Importance Sampling werden stattdessen Zufallszahlen aus einer modifizierten Wahrscheinlichkeitsverteilung mit dem Ziel verwendet, durch eine Varianzreduktion zu rechentechnisch effizienteren Berechnung zu kommen.

Die Grundidee sei an einem einfachen Beispiel veranschaulicht. Die Zufallsvariable mit der Wahrscheinlichkeitsfunktion

hat den Erwartungswert und die Varianz Der Monte-Carlo-Schätzer für basierend auf Zufallszahlen aus der Verteilung von hat dann die Varianz

Der Erwartungswert kann mit den drei Stellen , und und den Wahrscheinlichkeiten für als

geschrieben werden. Dabei werden die so gewählt, dass sie positiv sind und sich zu Eins addieren und damit als Wahrscheinlichkeiten interpretiert werden können.

Für die Zufallsvariable mit der Wahrscheinlichkeitsfunktion

gilt dann und . Die Varianz von hängt von den gewählten Wahrscheinlichkeiten ab und kann bei geeigneter Wahll erheblich kleiner als die Varianz von sein.

Z. B. ergibt sich für die Wahl die Varianz im Vergleich zu . Der Monte-Carlo-Schätzer für basierend auf Zufallszahlen aus der Verteilung von hat dann die Varianz

Durch Zufallszahlenerzeugung mit der Verteilung von lässt sich also der Erwartungswert mit kleinerer Varianz und damit bei gleicher Anzahl von erzeugten Zufallszahlen mit größerer Genauigkeit bestimmen.

Definition Importance Sampling

Die Methode des Simple Sampling ist meistens nicht sehr effizient, da oft nur wenige relevante Zustände in die Mittelwertbildung eingehen. Um dieses Problem zu umgehen und so die Standardabweichung des gemessenen Mittelwertes bei gleichem Stichprobenumfang zu reduzieren, versucht man Zustände mit einem größeren Gewicht häufiger in die Mittelwertbildung eingehen zu lassen als Zustände mit einem geringeren Gewicht: Der obigen Schätzer des Simple Sampling kann durch Erweitern mit auch wie folgt ausgedrückt werden:

Werden Realisierungen mit der Wahrscheinlichkeit erzeugt (Stichprobenentnahme nach Wichtigkeit englisch importance sampling, ), wird also eine andere Stichprobe S' erzeugt, so berechnet sich der geschätzte Mittelwert in der Folge einfach mithilfe von

für

Die Wahrscheinlichkeitsdichte wird auch als "biased distribution", "proposal distribution" oder "sample distribution" bezeichnet. Da die Stichprobe aus der Verteilung gezogen wurde, müssen die Erwartungswerte durch entsprechendes Reweighting mit errechnet werden (siehe Formel) und nicht einfach als arithmetischen Mittel. Dieses Reweighting wird beispielsweise beim "Temperature Reweighting" von Monte-Carlo Simulationen molekularer Systeme genutzt bei denen Aussagen über angrenzende Temperaturen gemacht werden sollen.

Wichtige Schlussfolgerung

Werden die Realisierungen mit einer Wahrscheinlichkeit proportional zu vorgeschlagen (das ist gerade die Metropoliswahl), so ergibt sich

Gerade, dass hier nur die Proportionalität erforderlich ist, ist ein Vorteil der Methode, da die Zustandssumme nicht ausgewertet werden muss.

Um eine Stichprobenentnahme nach Wichtigkeit in der Praxis zu erreichen, geht man von einer Startkonfiguration aus und erzeugt mithilfe des Metropolisalgorithmus eine Markow-Kette aus Systemzuständen.

Anderes Beispiele

Neben der obigen Wahl für die Auswahl von Elementen der Ergebnismenge gibt es weitere Möglichkeiten. Z. B. kann das multikanonische Ensemble simuliert werden, indem die Wahl getroffen wird (wobei die Zustandsdichte der Energie ist, welche dem Zustand zugeordnet ist).

Literatur

  • W. K. Hastings: Monte Carlo Sampling Methods Using Markov Chains and Their Applications. In: Biometrika. Band 57, 1970, S. 97–109.
  • Thomas Müller-Gronbach, Erich Novak, Klaus Ritter: Monte Carlo-Algorithmen. Springer-Verlag, Berlin 2012, ISBN 978-3-540-89140-6, Abschnitt 5.4 Importance Sampling, S. 155–166, doi:10.1007/978-3-540-89141-3.
  • Christian P. Robert, George Casella: Monte Carlo Statistical Methods (= Springer Texts in Statistics). 2. Auflage. Springer, 2004, ISBN 0-387-21239-6, Kap. 3.3 Importance Sampling, S. 90–107, doi:10.1007/978-1-4757-4145-2.
  • R. Srinivasan: Importance sampling – Applications in communications and detection. Springer-Verlag, Berlin 2002, ISBN 978-3-540-43420-7.
  • Suojin Wang: Importance Sampling. In: Samuel Kotz et al. (Hrsg.): Encyclopedia of Statistical Sciences. 2. Auflage. Band 5. Wiley, New York 2006, ISBN 978-0-471-15044-2, S. 3347–3353, doi:10.1002/0471667196.

Einzelnachweise

  1. International Statistical Institute: Glossary of statistical terms.
  2. Bachmann, M. (2014). Thermodynamics and Statistical Mechanics of Macromolecular Systems. Vereinigtes Königreich: Cambridge University Press. Seiten 104, 105 Google books
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.