渣大米
mp.weixin.qq.com
Related
Highlights
样本效率做到了之前的deepmind的5-6倍。预计能在10h内实现双足的实机学习
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
2
2
LLM Powered Autonomous Agents
Lilian Weng
lilianweng.github.io
我们可以通过确定agent是否了解环境模型来划分可用的RL算法。 了解模型可以使agent提前知道状态转移概率矩阵和未来的reward
【重磅综述】用于机器人操作的深度强化学习- 知乎
整个sim-to-real过程如图4所示,共分为四步:
(1)识别出机器人的物理参数,并对机器人进行刚体运动学/动力学建模;
(2)收集真实的关节电机执行数据,训练一个Actuator Net;
(3)在仿真中,利用Actuator Net建模关节电机,并结合第一步中的刚体运动学/动力学建模,进行强化学习;
(4)将第3步中训练得到的策略部署到真机上。
小米技术
•
Article
Unlock unlimited Related cards