DeepMind 运作示意图,左侧为从环境中得到资料并进行分析,右侧是根据现有可执行的指令做出决策
Oriol 指出由于游戏画面均是由像素构成,因此是非常适合验证AI 演算法的平台,像是先前团队就曾使用Atari 的许多经典游戏来进行模拟。在这个部分,由于画面构成相对简单,DeepMind 会先了解整体游戏架构,找出控制物件的方法,此时工程师只要下达尽可能达到高分目标的指令,DeepMind 就会不断地优化控制,达到人类可能无法完成的高分。
周 | 月