Robbins, Herbert A sequential decision problem with a finite memory. (English) Zbl 0073.13402 Proc. Natl. Acad. Sci. USA 42, 920-923 (1956). Verf. behandelte in einem früheren Vortrag [Bull. Am. Math. Soc. 58, 527–535 (1952; Zbl 0049.37009)] u. a. folgendes Problem: Wie muß man mit zwei Münzen mit unbekannten ,,Kopf”-Wahrscheinlichkeiten \(p_1\), und \(p_2\), werfen, also insbesondere, mit welcher der beiden Münzen muß man bei jedem Wurf werfen, um. die ,,Kopf”-Zahl im Mittei zu maximieren? Diese Aufgabe wird hier auf folgende völlig neuartige Weise verändert. Der Experimentator besitzt nur ein Erinnerungsvermögen über \(t\) Würfe, d. h. die Auswahl der jeweils zu werfenden Münze darf nur von den jeweils vorangegangenen \(t\) Wurfergebnissen abhängig sein. Es wird eine Regel, die diese Bedingung erfüllt, angegeben, die als Limes des Erwartungswertes dieser mittleren ,,Kopf”-Zahl (bei wachsender Wurfzahl) \((p_1 q_2^t + p_2 q_1^t)/(q_1^t + q_2^t)\) ergibt. Die Frage der Optimalität wird gestellt, bleibt aber offen. Reviewer: D. Morgenstern Page: −5 −4 −3 −2 −1 ±0 +1 +2 +3 +4 +5 Show Scanned Page Cited in 2 ReviewsCited in 16 Documents MSC: 91A35 Decision theory for games 62C05 General considerations in statistical decision theory Citations:Zbl 0049.37009 PDFBibTeX XMLCite \textit{H. Robbins}, Proc. Natl. Acad. Sci. USA 42, 920--923 (1956; Zbl 0073.13402) Full Text: DOI