直接策略的RL直接优化目标函数,对策略进行参数化表示,与值函数相比,策略化参数的方法更简单,更容易收敛。()


直接策略的RL直接优化目标函数,对策略进行参数化表示,与值函数相比,策略化参数的方法更简单,更容易收敛。()

A.正确

B.错误

正确答案:正确


Tag:人工智能导论 策略 函数 时间:2023-12-18 21:19:49