在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。


在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。

A.大;小

B.大;大

C.小;小

D.小;大

正确答案:A


Tag:概率 动作 函数 时间:2022-12-13 00:08:41