直接策略的RL直接优化目标函数，对策略进行参数化表示，与值函数相比，策略化参数的方法更简单，更容易收敛。（）_精华吧

直接策略的RL直接优化目标函数，对策略进行参数化表示，与值函数相比，策略化参数的方法更简单，更容易收敛。（）

精华吧→答案→知到智慧树→未分类

直接策略的RL直接优化目标函数，对策略进行参数化表示，与值函数相比，策略化参数的方法更简单，更容易收敛。（）

A.正确

B.错误

正确答案：正确

Tag：人工智能导论策略函数时间：2023-12-18 21:19:49

上一篇：下列对强化学习特点说法错误的是：（）
下一篇：下列哪个选项不属于进行迁移学习的原因：（）

相关答案

热门答案