HOME/ /強化学習
2017.07.13

強化学習

強化学習

「強化学習」は明確な正解がないときに、どの行動が「最適」か選択するように学習させる手法です。

ここでは囲碁AIの「Alpha Go」を例に説明をします。

囲碁は手のパターンが膨大過ぎて、既存の最新のコンピュータでも、手を読み切ることは不可能です。よって、強化学習により、勝ちまでの手を読み切る代わりに、どの手を打てば勝ちに近づくかを学習させています。試合を繰り返し行い学習させると、最適な行動のみを選択するようになります。こうして「Alpha Go」は強くなっていったのです。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

AIの法律上の注意点は?|責任は誰がとるのか・著作権はあるのか

アリババDAMOアカデミー、2022年のテクノロジートレンド予測を発表

エクサウィザーズ、パーソルテクノロジースタッフのDX/AI人材の育成を共同で開始

河川水位をAIで予測。三信電気とMatrixFlowがAIを共同開発

日テレ、ドコモら3社がニュース記事自動要約サービスを開発、β版の提供開始

【製造業でも進むDX】先端技術や新素材を活用した社会課題の解決へ -三井化学DXオンラインイベントレポート

あなたにおすすめの記事

AIの法律上の注意点は?|責任は誰がとるのか・著作権はあるのか

アリババDAMOアカデミー、2022年のテクノロジートレンド予測を発表

エクサウィザーズ、パーソルテクノロジースタッフのDX/AI人材の育成を共同で開始

河川水位をAIで予測。三信電気とMatrixFlowがAIを共同開発

日テレ、ドコモら3社がニュース記事自動要約サービスを開発、β版の提供開始

【製造業でも進むDX】先端技術や新素材を活用した社会課題の解決へ -三井化学DXオンラインイベントレポート