当前位置：和泉文库 > 计算机 > 浏览文档

华中科技大学：计算机科学与技术学院《强化学习》课程教学大纲

文件格式：DOCX，文件大小：27.51KB，售价：1.2元

文档详细内容（约5页）

平时成绩：30%。这部分成绩为形成性评价成绩，包括课后作业、随堂测验、课堂表现等部分的成绩构成。课程报告成绩：70%。本课程结课考查采用撰写课程报告的形式。课程考核成绩评定如表1所示。表1课程考核与成绩评定考核与评价方式及成绩占所在项的比例（约）课程目标平时成绩课程报告成绩150%30%250%70%总成绩平时总成绩×0.3+课程报告总成绩×0.72.考核与评价标准表2课程目标1评定标准等级评定标准优秀能准确阐述相关理论概念，清晰解释其数学原理和内在联系；能将数学和算(90-法思想融会贯通，创新性地应用于复杂智能决策问题的建模和分析；推理分100)析严谨，过程完整，结论正确。对强化学习基础理论有较深入的理解，能正确说明主要概念和原理；能将数良好学和算法思想有效地应用于智能决策问题的建模和分析：推理分析较为严(75-89)谨，过程较完整，结论正确。对强化学习基础理论有基本的理解，能阐述主要概念；在应用数学和算法思中想解决问题时，存在一定困难；推理分析不够严谨，过程不完整，结论基本(60-74)正确。对强化学习基础理论理解不正确，对主要概念存在显著误解；无法将数学和不及格算法思想应用于问题的建模和分析；推理分析错误较多，过程不完整，结论(0-59)错误。表3课程目标2评定标准等级评定标准优秀全面理解并熟练掌握Q学习、SARSA、策略梯度、深度强化学习等经典和最(90-新强化学习算法；能够独立选择和应用适当的算法解决复杂实际问题，展示100)出高度的创新性和有效性。较好理解并掌握Q学习、SARSA、策略梯度、深度强化学习等强化学习算法，良好能够正确应用：能够选择合适的算法解决实际问题，应用过程中表现出一定(75-89)的创新性。对Q学习、SARSA、策略梯度、深度强化学习等强化学习算法有基本理解，中掌握程度有限：能够尝试应用算法解决实际问题，但选择和应用过程中存在(60-74)定的错误或不当之处，创新性不足。不及格对Q学习、SARSA、策略梯度、深度强化学习等强化学习算法理解不够，应(0-59)用存在较大错误：无法有效选择和应用适当的算法解决实际问题，缺乏必要

平时成绩：30%。这部分成绩为形成性评价成绩，包括课后作业、随堂测验、课堂表现等部分的成绩构成。课程报告成绩：70%。本课程结课考查采用撰写课程报告的形式。课程考核成绩评定如表 1 所示。表 1 课程考核与成绩评定课程目标考核与评价方式及成绩占所在项的比例(约) 平时成绩课程报告成绩 1 50% 30% 2 50% 70% 总成绩平时总成绩×0.3+课程报告总成绩×0.7 2. 考核与评价标准表 2 课程目标 1 评定标准等级评定标准优秀（90- 100）能准确阐述相关理论概念，清晰解释其数学原理和内在联系；能将数学和算法思想融会贯通，创新性地应用于复杂智能决策问题的建模和分析；推理分析严谨，过程完整，结论正确。良好（75-89）对强化学习基础理论有较深入的理解，能正确说明主要概念和原理；能将数学和算法思想有效地应用于智能决策问题的建模和分析；推理分析较为严谨，过程较完整，结论正确。中（60-74）对强化学习基础理论有基本的理解，能阐述主要概念；在应用数学和算法思想解决问题时，存在一定困难；推理分析不够严谨，过程不完整，结论基本正确。不及格（0-59）对强化学习基础理论理解不正确，对主要概念存在显著误解；无法将数学和算法思想应用于问题的建模和分析；推理分析错误较多，过程不完整，结论错误。表 3 课程目标 2 评定标准等级评定标准优秀（90- 100）全面理解并熟练掌握 Q 学习、SARSA、策略梯度、深度强化学习等经典和最新强化学习算法；能够独立选择和应用适当的算法解决复杂实际问题，展示出高度的创新性和有效性。良好（75-89）较好理解并掌握 Q 学习、SARSA、策略梯度、深度强化学习等强化学习算法，能够正确应用；能够选择合适的算法解决实际问题，应用过程中表现出一定的创新性。中（60-74）对 Q 学习、SARSA、策略梯度、深度强化学习等强化学习算法有基本理解，掌握程度有限；能够尝试应用算法解决实际问题，但选择和应用过程中存在一定的错误或不当之处，创新性不足。不及格（0-59）对 Q 学习、SARSA、策略梯度、深度强化学习等强化学习算法理解不够，应用存在较大错误；无法有效选择和应用适当的算法解决实际问题，缺乏必要

点击进入文档下载页（DOCX格式）

已到末页，全文结束

您可能感兴趣的文档

点击购买下载（DOCX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录