【重磅综述】用于机器人操作的深度强化学习- 知乎
【重磅综述】用于机器人操作的深度强化学习- 知乎
zhuanlan.zhihu.com
Related
Highlights
对于locomotion,外界环境大多可以视为一个刚体,物理特性基本可以忽略。这使得可以花费更多时间来建立机器人本体的精确物理模型,以及设计更复杂的物理引擎。这是为什么RL更适合Locomotion
渣大米
•
Article
整个sim-to-real过程如图4所示,共分为四步:
(1)识别出机器人的物理参数,并对机器人进行刚体运动学/动力学建模;
(2)收集真实的关节电机执行数据,训练一个Actuator Net;
(3)在仿真中,利用Actuator Net建模关节电机,并结合第一步中的刚体运动学/动力学建模,进行强化学习;
(4)将第3步中训练得到的策略部署到真机上。
小米技术
•
Article
模拟训练、现实finetune,显然是有意义的,以前使用model-based的奇怪人也喜欢用
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
强化学习是机器学习的一个分支。与监督学习不同,在强化学习中,智能体通过与环境不断交互进行试错学习,其目标是最大化累积回报。
小米技术
•
Article
Unlock unlimited Related cards