小米技术
mp.weixin.qq.com
Related
Highlights
模拟训练、现实finetune,显然是有意义的,以前使用model-based的奇怪人也喜欢用
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
对于locomotion,外界环境大多可以视为一个刚体,物理特性基本可以忽略。这使得可以花费更多时间来建立机器人本体的精确物理模型,以及设计更复杂的物理引擎。这是为什么RL更适合Locomotion
渣大米
•
Article
2
2
Training great LLMs entirely from ground zero in the wilderness as a startup — Yi Tay
Yi Tay
yitay.net
样本效率做到了之前的deepmind的5-6倍。预计能在10h内实现双足的实机学习
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
Unlock unlimited Related cards