登录  注册

首页

()是通过与环境的交互和奖惩机制,反复重演,完成最优策略的自主学习。

(A)深度学习

(B)监督/半监督学习

(C)无监督学习

(D)强化学习

参考答案

更多试题》》》