登录
注册
首页
()是通过与环境的交互和奖惩机制,反复重演,完成最优策略的自主学习。
(A)深度学习
(B)监督/半监督学习
(C)无监督学习
(D)强化学习
参考答案
更多试题》》》
1
软件产业的发展态势表现为()。
2
中央应对疫情工作领导小组多次开会研究部署疫情防控工作,前方指导组也积极开展工作。
3
第五次中央民族工作会议召开的背后有哪些机遇?( )
4
浙江省柳市生态工业小镇,是一个典型的生态工业小镇,而且他是第一批中国特色小镇。对错
5
《数字经济干部读本》的第十四讲指出,提升全民全社会数字素养和技能。
6
经济要行稳致远,最关键是要依靠创新增强发展内生动力。