スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

未解決問題

民主主義の話、コンピュータ碁のモンテカルロ法の話、等価原理の話、保留になってます。待ってる人がいたらごめんなさい。

でも、コイントスで3択より面白い問題が出て来たんです。これ↓


スロットマシーンに、右と左にハンドルが1つずつ付いています。それぞれ、当たる確率が(別々に)決まっていますが(注)、その確率はあなたには知らされていません。あなたはこのスロットマシーンにN回挑戦してもらえる事になりました。当たりの回数を出来るだけ増やすためには、どうやってハンドルを選べば良いでしょうか?


N=1、1回しかやらせてもらえない場合は、どっちを引いても関係ありません。どっちが当たりやすいのか全然分からないので。

N=2、2回やらせてもらえるのなら、最初に引いた方で当たればまたそっちを選んで、はずれたらもう片方を選ぶのが最善策。

3回以上になると、どうするのが最適なのか、明らかではありません。基本的な作戦としては、どっちが当たりやすいのか分かるまで両方とも試して、分かったら当たりやすいと思う方だけを引き続ける事になります。

Nが大きくなった場合、例えば1万回挑戦出来る場合に、何回くらいは両方試していた方が良いのか、昨日の夜、ベトナム料理屋で物理仲間と計算していたんですが、閉店時間になってやむなく断念(笑)最初は紙ナプキンに書いていたのが、紙のテーブルクロスを埋めてしまいました。使い捨てだから良いんです(汗)


なんで面白いと思っているかと言うと、この問題、日常生活での色んな判断をする際に似ているんです。

例えば、近所にあるラーメン屋Aとラーメン屋B、どっちが美味しいのかは食べてみるまで分かりません。しかも味にはちょっとムラがあって、毎回すごく美味しい、と思うわけでもない。何回試したあとで、どっちの店に決めるのか。

他にも例は挙げられます。満足のいく休日の過ごし方だったり、通勤に使う道だったり。起こる事にある程度のムラがあって、試してみるまでどれくらいの割合で当たりが出るのか分からない事ならなんでもいいんです。2択である必要も全くありません。

数学の問題としては、期待値(当たりが出る平均回数)を一番多く出来る戦術に興味があるんですが、それと同じくらい、人間が(動物も)実際にどういう戦術を使っているのかも気になります。進化によってインプットされた、かなり良いプログラムを持っているはずなので。

この問題そもそも、元はと言えば、人工知能の問題らしいです。

(注):確率は、0から1までの数字からランダムに選ばれていて、どの数字が選ばれる確率も同じだとします。

テーマ : 数学
ジャンル : 学問・文化・芸術

コメントの投稿

非公開コメント

左右のハンドルの当選確率がN分の1以下(未満?)の可能性もあるので、そんな場合、N回トライしても全く当たりが出ない可能性もあるわけで、最善策を探すのは難しいように思いますケド。
(自信はありません・・・)

仮に(当たる確率が)左が2分の1で右が3分の1だったとしても、左じゃなくて右の方が先に当たる確率が、

(左に3回トライして全て外す確率)=8分の1

(右に3回トライして1回当たる確率)=27分の3→9分の1

となって、その差は72分の1。
(※3回トライする例えにしたのは、右の当選確率が3分の1なので問題をシンプルにするため)
なので、このケースだと、左右のハンドルの当選確率を見積もるのに必要な回数は各72回ということになるんですかね。(これまた、自信ないですが)
計算するのがめんどかったんで、右のハンドルで当たりが2回もしくは3回出る場合を除きましたが、そうなると頭こんがらがってきますね、僕は。

ちなみに、記事の後半の人間の意思決定は、経済学だと機会費用の考え方じゃないかと思います。

あ、でも、アシュリーさんは数学的アプローチをしたい・・・んですよねぇ?

kashさん

両方のハンドルの当たる確率がほぼ一緒なら、間違った策を選んでも大きな損害はありません。両方とも当たりの出る確率が低すぎる、と言うのはこれに分類されます。問題なのは、もっとありきたりな確率の組み合わせの場合、どれくらい試せばそれなりに自信を持って確率の高い方を選べるのか、という事です。

左右のハンドルの当選確率は、「○回やると正確に見積もれる」、という性質のものではありません。分かるのは、この確率だと思う、という数字の分布です。例えば2分の1の確率で当たりが出るとしても、10回連続で当たりが出る事は全くあり得ない事ではないですから、10回連続で当たったからと言って完全に除外する事は出来ません。2分の1である可能性はとても低い、と分かるだけです。

逆に言うと、72回もやらなくても、2分の1と3分の1のハンドルの違いは、ある程度分かる可能性があります。(計算はしていませんが。)言いたいのは、違いが分かるかどうかは、分かると分からないの両極だけではなくて、60%、70%、80%...の確率で右の方が高い、というグラデーションがある事です。どれくらいの自信を持った時に、片方に集中すれば良いのか、というのが問題なんです。

これが機会費用の問題なのはもちろんです。(経済学もとても数学的だと思いますが...)でも、機会費用の一言では済ませられません。両方のハンドルの当たる確率が分かっていなければ、機会費用は計算出来ないからです。

知りたいのは、人間が、直感的に、どのように確率を見積もるのか、と、見積もってから、どうやってハンドルを選ぶのか、です。どちらも、意識的に計算をしているものではありません。進化によって作られたプログラムで、無意識に処理されている事です。

これまた学術的好奇心をそそる

計算系はまだ手をつけていないので、
「無意識に処理されている」
「進化によってインプットされた、かなり良いプログラムを持っているはず」
について。
計算については後ほど…。
特にkashさんご指摘の、「統計誤差」に関する議論はまた別の観点から言って面白いですし。


合理的に考えると、人間の選択行動は
「進化によってインプットされた、かなり良いプログラムを持っているはず」
ではあります。
しかし、社会学的見地では、
人間は常に合理的に主体的選択を行っているわけではない、
という論理展開をすることが多いです。
デュルケムの「自殺論」もそうですが、
社会的要因によって人間が選択していることも少なくないということもいえそうです。

ラーメン屋を選択するときに、味で選択する人や場合もあれば、
雑誌記事で選ぶ人もいたりってな具合。
だから「人間の選択行為が進化している」とは言い切れないのかもしれない、ってなことも思ったり。


ちょっとアシュリーさんの話とは次元が異なってしまっている論理展開ですが(笑)。
しかし、こうしたゲーム理論的な話の面白いところは、
そうした複数因子を敢えて取り除いて、
「選択行動が常に合理的に進められる」として考えるところにあるわけで、
(そういう意味で上記の論理は野暮ですが 笑)
常に合理的な選択を行い続けることができれば、選択の最適化・進化が達成できるはずだ、
というのは学問的にいっても面白いですね。

まさゆきさん

人間の選択行動については、言葉足らずだったようです。自分が一番気になっているのは、最善策と比較して、人間の判断にはどういったバイアスがあるのか、というところです。この2つが一緒だとは思っていませんし、一緒だったら何も面白くないので(笑)

進化が作り上げた人間の思考回路は、ランダムでハンドルを選ぶのよりずっと良い戦術を選んでくれるはずですが、これはあくまで局所的な最善策に近いものです。日本のどこかからとにかく上へと登り始めたら、決してエベレストを登頂する事は出来ないように、本当の最善策には永遠に辿り着けないルートを取っている可能性の方が高いですから。

人間の場合は確かに、社会的、文化的な要因が大いに絡んでくるので、遺伝子にエンコードされた判断基準、という概念自体が無意味かもしれません。だからこそ、動物の判断も見てみたいです。(ネズミの実験でありそうです)

No title

「最善策と比較して、人間の判断にはどういったバイアスがあるのか」
モンテカルロやコンピュータの将棋や碁の話と似ているように感じますね。
(さっきの俺の話は、
「人間は常に合理的行動をするわけではない」
って話なだけで、若干別次元だし、それだけに野暮でしたね 苦笑)

でもって、その「バイアス」って話になってくるのも、
やはり俺の興味分野であります。
社会学の中でもsurvey系は特にそこに照準を当てているからです。

人工知能ロボットが仮にいたとして、
”彼”が余暇の行動選択をどう取るのか、を想像してみると、
アシュリーさんの主題に近くなってくるんですかね。
ドラえもんがどら焼きが好きなのも、一考の余地あり、とかw

まさゆきさん

知能にアプローチしたい、という意味で一緒と言っていいと思います。自分の中であまり整理出来ていないのですが、限定合理性に関わる話が気になっているのかな、とは思います。

バイアスの部分は、民主主義の話にも絡んでくるので、また広がりがあるんですが、これはまた後で...

人工知能については、今年の始めに↓こんな物を書きました。シリーズ物です。時間があったらどうぞ(笑)
http://grizz.blog60.fc2.com/blog-entry-719.html

No title

誤解があるようなので、一応。

僕が「機会費用の話だな~」って思ったのは、スロットの問題ではなくて、どっちのラーメン屋にしようか?とかの人間の曖昧な基準による選択について、です。

アシュリーさんのおっしゃるようにスロットの問題も多少は機会費用が関係してくるっっちゃあしますけど、機会費用は会計学上に現れにくい人間の不合理性にスポットを当てるための概念だと思うので、記事の問題を数学的に解決するのには適切でないという考えには同意です。

kashさん

ラーメン屋の問題とスロットマシーンの問題は、概念的に言って同一だと認識しているので、スロットマシーンの部分をラーメン屋に変えても、僕の言いたい事は変わりません。

機会費用についての認識が違うようです。機会費用と言うのは、人間にしろロボットにしろ、合理的に選択する際に必要な概念、のはずです。(kashさんと僕が使っている、合理性という言葉の定義が違う可能性はあります)

例えば、10円しか持っていない時に飴かガムが買えたとします。そして、どちらも(10円玉を持ったままでいるより)欲しいけれど、飴よりもガムの方が欲しいとします。

この場合、10円よりも飴の方が好ましい、と言う判断をしていたので、10円を使って飴を買うのは利益のある取引です。ですが、ガムの方が飴よりもっと欲しかったわけで、ガムを買った方がさらに良かった事になります。つまり、飴を買ってしまうのは合理的ではありません。

合理的な判断は、飴を買ってしまうとガムが買えない、という機会費用を考慮しなければ出来ないわけです。(経済学者は大体の場合、人間の判断は合理的だ、と言うのを前提として物を考えます。事実に即しているから、というより、その方が数学的に扱いやすいからです。)

とにかく機会費用と言うのは、複数の選択肢があって、1つを選ぶと他が選べない、という時には必ず関わってくる概念で、人間が選んでいるかどうかとは別問題のはずです。機会費用の概念が、「記事の問題を数学的に解決するのには適切でない」とは思っていません。むしろ正反対です。機会費用をどうやって計算するのかが解決出来れば、問題は解けています。

まず、1コ前の僕のコメントの言葉の使い方がまずかったのをお詫びしておきます。
文末の「~ので」のところは「~し」という風に僕の考えであることを強調するべきでした。
コメント書き込んだ後、訂正したコメント書き込もうか迷ったんですけど、「ま、いっか」で済ませちゃいました。

で、アシュリーさんの例えを用いさせてもらうと、飴かガムを買いに来たけども(ガム>飴)、ガムが売り切れてて明日にならないと入荷しないような時に機会費用が発生するもんだと思ってます。

飴で妥協するか、明日まで我慢するか、ちょっと遠くの別の店に行くか、など。

合理的という言葉に関しては、どう使うべきなのか自信はないんですけどね(汗)。
アシュリーさんの使う合理的とどう違いがあるのかはわからないです。

kashさん

いえいえ、お詫びの必要は無いと思います。

合理性の定義が一致しているかどうかは分からないですし、そこが重要なポイントでもないと思うのですが、機会費用に関しては、経済学の用語として明らかなのでハッキリさせておきたいです。機会費用は、選択肢が複数あり、1つを選べば他が選べない、という場合には常に発生します。

Wikipediaより。「機会費用(きかいひよう opportunity cost)とは、選択されなかった選択肢のうちで最善の価値のことである。」

goo辞書より。「財をある目的に用いたために放棄された他の利用方法から得られるであろう利得のうち最大のもの。」

時間なりお金なり道具なり、なんらかの資源(利用可能な物)をある目的に使う時に、他の使い道をしたらどのような利益があるのか、というのが機会費用です。

kashさんの考えられているのは、別の概念のように思います。

定義はアシュリーさんの引用した通りです。

別に僕はアシュリーさんの例えは機会費用じゃないと言ってるわけじゃないですよ。

それから、僕の例えたものも機会費用の定義から外れるものでもないはずです。
(ガムを売り切れにしたのは、時間的なロスも機会費用になることを言いたくて例えました)

機会費用の面白いところは、何を以て最善とするか?だと思います。

記事の内容から脱線してるのでスロットの問題についてちょっと。

ハンドルの確率について何かわかるまで手を出さない、というのはどうですか?
これは、まぁ、時間的制約が無い場合に限りますし、問題に正面からアプローチしてると言えませんけど。

ただ、スロットを回す回数というチャンスを減らさないというのは、一応、戦略の1つとしてはアリだとは思うんですよ。

ま、でも、それだと、いつまでも未解決問題のままですが(苦笑)。

kashさん

>それから、僕の例えたものも機会費用の定義から外れるものでもないはずです。

もちろんそうなんですが、なぜわざわざ、機会費用が分かり辛い例を出すのかな、と思うんです。選ばない選択肢があって、そこにも利益がある、というのが機会費用のエッセンスだと思うので。

何をもって最善とするかは、まさゆきさんとのやりとりにある、社会的な要素や、バイアスに関わってくる話でもありますね。これは面白いと思いますよ。

>ハンドルの確率について何かわかるまで手を出さない、というのはどうですか?

この問題では、時間はハンドルを引くことでしか測れません。どちらのハンドルを引いて、当たったのか外れたのか、以外に情報はなにもないという事でやってください。これもまた、情報が不確定な中での判断、というエッセンスを引き出したいがために、不要な要素を省いているんです。
FC2ブログランキング

FC2ブログランキング

プロフィール

アシュリー

Author:アシュリー
カリフォルニア州バークリー在住、元スポーツジャンキーのアシュリーです。

今観るスポーツは、アーセナル(サッカー)とグリズリーズ(バスケ)、あとテニス。

専門の物理ネタ以外にも、色々書いていくつもりです。

Twitterをハンドル名Inoueianでやっています。

ブログ内検索
カレンダー
05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -
最近の記事
最近のコメント
最近のトラックバック
カテゴリー
リンク
RSSリンク
月別アーカイブ
メールフォーム

名前:
メール:
件名:
本文:

カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。