强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。


强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。

A.输出

B.探索

C.输入

D.开发

正确答案:B


Tag:策略 动作 效果 时间:2022-12-14 19:49:09

热门答案