强化学习/Reinforcement Learning，资源教程下载

智能简介

人工智能（Artificial Intelligence），英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来，理论和技术日益成熟，应用领域也不断扩大，可以设想，未来人工智能带来的科技产品，将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。

课程介绍

该课程为强化学习的基础课，在智能机器人控制中有大量的应用，它的“进阶”版DeepReinforcement Learning（AlphaGo的核心技术之一）。有别于“经典”的控制理论，比如Classical Control Theory (根轨迹、频域设计那些), Robust Control, MPC,Adaptive Control等等，它是Model-Free控制理论，相对来说有更大的自由度吧。它的部分控制策略也是有stability保证的，具体可以去查查paper吧（我是自控领域出生，对机器学习领域发展出来的控制理论了解不深）。

课程目录

– Lecture 1: Introduction to Reinforcement Learning

– Lecture 2: Markov Decision Processes

– Lecture 3: Planning by Dynamic Programming

– Lecture 4: Model-Free Prediction

– Lecture 5: Model-Free Control

– Lecture 6: Value Function Approximation

– Lecture 7: Policy Gradient Methods

– Lecture 8: Integrating Learning and Planning

– Lecture 9: Exploration and Exploitation

– Lecture 10: Case Study: RL in Classic Games

资源下载此资源仅限VIP下载，请先

充值比例 1元=1学分
资源失效，请咨询客服
客服QQ 980264305

资源下载

下载价格VIP专享

仅限VIP下载

充值比例 1元=1学分
资源失效，请咨询客服
客服QQ 980264305

强化学习/Reinforcement Learning，资源教程下载

评论0

在线客服

升级VIP

返回顶部

强化学习/Reinforcement Learning，资源教程下载

猜你喜欢

评论0

在线客服

升级VIP

返回顶部