Course overview What is AI? A brief history The state of the art
文件格式: PDF大小: 13.46MB页数: 34
背景介绍 智能机器人技术 人-机器人交互 决策、规划 感知、行为预测、世界模型 地图、定位、SLAM 运动规划、控制 仿真器 机器人安全模型
文件格式: PDF大小: 9.81MB页数: 51
背景 MDPs 强化学习问题 蒙特卡洛方法 (Monte Carlo Methods) 蒙特卡洛预测(Monte Carlo Prediction) 蒙特卡洛控制(Monte Carlo Control) 时序差分学习 (Temporal-Difference Learning) 时序差分预测(TD Prediction) 时序差分控制(TD Control) Sarsa:on-policy Q-learning : off-policy 策略梯度 (Policy Gradient) Monte-Carlo Policy Gradient Actor-Critic Policy Gradient 深度强化学习 Deep Q-Networks (DQN) Policy Gradients for Deep Reinforcement Learning
文件格式: PDF大小: 3.33MB页数: 99
深度学习简介 Neural Network Goodness of Function Pick the Best Function 前馈神经网络 Tips for Deep Learning 卷积神经网络(Convolutional Neural Network, CNN) 循环神经网络(Recurrent Neural Network, RNN) Keras CNN in Keras RNN in Keras
文件格式: PDF大小: 11.58MB页数: 170
自动规划概述 经典规划 (Classical Planning) 规划问题 状态空间规划 (State-Space Planning) 规划空间规划 (Plan-Space Planning) 新经典规划 (Neoclassical Planning) 规划图技术 (Planning-Graph Techniques) Planning as {SAT, CSP, ILP, …} 经典规划的扩展 分层任务网规划 不确定规划 非确定规划 概率规划
文件格式: PDF大小: 1.81MB页数: 61
First-Order Logic Why FOL? Syntax and semantics of FOL Using FOL Knowledge engineering in FOL Inference in FOL Reducing first-order inference to propositional inference Unification (合一) Generalized Modus Ponens(一般化分离规则) Forward and backward chaining Resolution
文件格式: PDF大小: 4.26MB页数: 91
背景 基础 Markov Processes Markov Reward Process Markov Decision Process Extensions to MDPs (Full Observable) Markov Decision Processes (MDPs) Partial Observable MDPs (POMDPs)
文件格式: PDF大小: 5.93MB页数: 102
Uncertainty Probability Syntax and Semantics Inference Independence and Bayes’ Rule Bayesian network Graphical models Bayesian networks Inference in Bayesian networks
文件格式: PDF大小: 1.67MB页数: 95
中国科学技术大学:《人工智能基础》课程教学资源(课件讲稿)Lecture 07 Logical Agents
文件格式: PDF大小: 6.84MB页数: 118
Games Perfect play(最优策略) minimax decisions α − β Pruning Resource limits and approximate evaluation Games of chance (包含几率因素的游戏) Games of imperfect information
文件格式: PDF大小: 5.73MB页数: 78