Sublime

RelatedInsightsHighlights

模拟训练、现实finetune,显然是有意义的,以前使用model-based的奇怪人也喜欢用

在机器人领域应用深度强化学习，目前主流的一些思路是什么？ - 知乎

对于locomotion,外界环境大多可以视为一个刚体,物理特性基本可以忽略。这使得可以花费更多时间来建立机器人本体的精确物理模型,以及设计更复杂的物理引擎。这是为什么RL更适合Locomotion

样本效率做到了之前的deepmind的5-6倍。预计能在10h内实现双足的实机学习