新智元报道
新智元报道
【新智元导读】最近,来自谷歌、DeepMind等机构的研究人员,提出了一种基于AutoML-Zero的方法AutoRobotics-Zero,可以从零开始发现zero-shot策略。与仅优化模型参数的神经网络不同,ARZ可以构建具备完整表达能力的控制算法。
全新ARZ框架
2种搜索算法:自然选择第一性原理
测试环境
结果
断腿
CADF 加快了进化速度,并产生了最佳的结果
倒立摆
讨论
新智元报道
全新ARZ框架
2种搜索算法:自然选择第一性原理
结果
CADF 加快了进化速度,并产生了最佳的结果
讨论