情報・数理系
数物系
基礎工学研究科
情報科学研究科
2022年

10.多腕バンディット問題を通して覗くコンピュータサイエンスの世界

受講場所
オンライン, 対面
担当研究科
基礎工学研究科, 情報科学研究科
担当者
増澤利光、泉泰介
最大受講人数
1人
【概要】

多腕バンディット問題とは、端的に述べると以下のような問題です:あなたの前には複数台のスロットマシンがあります。スロットを引くと、ある確率に従ってあなたは報酬(コイン)を得ることができます。ただし、報酬の期待値はマシンによって異なります。100回スロットを引けるとしたとき、あなたの報酬の総額をできるだけ多くするには、どのような戦略でスロットを引くマシンを選択すればよいでしょうか?
本テーマでは、この単純な問題を題材として、コンピュータサイエンスの基本的な考え方をまず学び・理解します。そののち、実際に自分自身で戦略を検討・プログラミングして、シミュレーションによる実験評価を行います。また、時間が許すようであれば、設計した戦略を2人対戦ゲームの最善手探索への応用へと適用することも試みます。

【備考】

PC上で実際にプログラムを組んで評価しますので、PCの基本操作(ファイルの操作、タイピング等)に関してはある程度習熟していることが必要です。プログラミングの経験は必ずしも必須ではありません。高校で習う標準的な数学的知識(主に場合の数、確率、指数・対数関数、数列等)は持ち合わせていることが望ましいです。