強化学習で突破口が?(6月9日)

今日やったこと

ワーキングメモリーレーニン

勉強

ゲーム開発

昨日のこのサンプル

f:id:alberto_hojo:20190608231420g:plain

から、ヒントを得たので、先日挫折したAIの作成にもう一度チャレンジしてみることにしました。

変更点はVisualObservation(観測)の方法です。

これまでは、

  • 自分の位置(x,z)

  • 敵の位置(x,z)

  • y軸周りに自分がどれだけ回転しているか(y)

  • y軸周りに敵がどれだけ回転しているか(y)

  • 自分の速度(v_x,v_z)

  • 相手の速度(v_x,v_z)

10個の変数のみを観測していました。

しかし今日は、

f:id:alberto_hojo:20190609153744p:plain

このようにプレイヤーの周りに放射状に透明の光線を飛ばして情報を得ることによって、103個の変数を観測しました。

結果、次のような感じになりました。

f:id:alberto_hojo:20190610000835g:plain

これを見る限り、スナイパーのように鋭い球を敵が投げてきています。

でもたまに怪しい挙動になっているので、もうちょっとコードを見直してみようと思います。

今日のパフォーマンス

JINS MEME ESという最新の学術研究の成果を元に人間の心理状態を測定できるウェアラブルバイスを使って本日の僕の集中状態を測定した結果は以下のようになりました。

f:id:alberto_hojo:20190610001502p:plain:w250

作業時間 8h18m

集中時間 2h54m

集中率 35%