强化学习/Reinforcement Learning,资源教程下载

image.png

智能简介

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。

课程介绍

该课程为强化学习的基础课,在智能机器人控制中有大量的应用,它的“进阶”版DeepReinforcement Learning(AlphaGo的核心技术之一)。有别于“经典”的控制理论,比如Classical Control Theory (根轨迹、频域设计那些), Robust Control, MPC,Adaptive Control等等,它是Model-Free控制理论,相对来说有更大的自由度吧。它的部分控制策略也是有stability保证的, 具体可以去查查paper吧 (我是自控领域出生,对机器学习领域发展出来的控制理论了解不深)。

课程目录

– Lecture 1: Introduction to Reinforcement Learning

– Lecture 2: Markov Decision Processes

– Lecture 3: Planning by Dynamic Programming

– Lecture 4: Model-Free Prediction

– Lecture 5: Model-Free Control

– Lecture 6: Value Function Approximation

– Lecture 7: Policy Gradient Methods

– Lecture 8: Integrating Learning and Planning

– Lecture 9: Exploration and Exploitation

– Lecture 10: Case Study: RL in Classic Games

资源下载此资源仅限VIP下载,请先
充值比例 1元=1学分
资源失效,请咨询客服
客服QQ 980264305
资源下载
下载价格VIP专享
仅限VIP下载
充值比例 1元=1学分
资源失效,请咨询客服
客服QQ 980264305

评论0

找资源,搜一下,更惊喜
没有账号? 注册  忘记密码?