智能简介
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。
课程介绍
该课程为强化学习的基础课,在智能机器人控制中有大量的应用,它的“进阶”版DeepReinforcement Learning(AlphaGo的核心技术之一)。有别于“经典”的控制理论,比如Classical Control Theory (根轨迹、频域设计那些), Robust Control, MPC,Adaptive Control等等,它是Model-Free控制理论,相对来说有更大的自由度吧。它的部分控制策略也是有stability保证的, 具体可以去查查paper吧 (我是自控领域出生,对机器学习领域发展出来的控制理论了解不深)。
课程目录
– Lecture 1: Introduction to Reinforcement Learning
– Lecture 2: Markov Decision Processes
– Lecture 3: Planning by Dynamic Programming
– Lecture 4: Model-Free Prediction
– Lecture 5: Model-Free Control
– Lecture 6: Value Function Approximation
– Lecture 7: Policy Gradient Methods
– Lecture 8: Integrating Learning and Planning
– Lecture 9: Exploration and Exploitation
– Lecture 10: Case Study: RL in Classic Games
评论0