欢迎来到计算机考试题库网 计算机题库官网
logo
全部科目 > 大学试题 > 计算机科学 > 人工智能

判断题

强化学习是使用标记的数据,但是可以通过某种方法知道你是离正确答案越来越近还是越来越远(即奖惩函数),强调的是如何基于环境而行动以取得最大化的收益。

    【参考答案】

    错误

    (↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)

    点击查看答案&解析
    微信小程序免费搜题
    微信扫一扫,加关注免费搜题

    微信扫一扫,加关注免费搜题