您的位置:首页 > 健康 > 美食 > NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration

NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration

2024/10/6 5:56:09 来源:https://blog.csdn.net/weixin_45800242/article/details/139674181  浏览:    关键词:NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration

引言

机器人学习的背景和挑战

本文的研究重点

现有方法的局限性

本文的创新点

相关工作

事先准备

视觉目标条件策略

ViNT在目标条件导航中表现出最先进的性能,但它不能执行无方向探索,需要外部的子目标建议机制。Nomad扩展了Vint,同时支持目标条件导航和无方向导航

使用拓扑图探索

在本文中,我们基于frontier探索,测试NoMaD的生成多样化子目标的能力和探索未知环境的能力。

方法

目标掩码

diffusion策略

训练细节

实验结果

我们在6个不同的室内和室外环境中对Nomad进行了评估,并制定了我们的实验来回答以下问题:

Q1:NoMaD模型与现有研究的对比

点估计指的是预测动作时输出单一的确定之,而不是分布或者多种可能的结果。

分析跨基线的策略预测(参见图5),我们发现,虽然自回归策略表示(原则上)可以表示多峰分布,但预测在很大程度上是单峰的,相当于策略学习平均操作分布。子目标扩散基线倾向于很好地表示多个模式,但不是很健壮。Nomad始终如一地捕捉多峰分布,并在目标图像的条件下做出准确的预测。

Q2:统一策略和单独的策略对比

Q3:视觉编码器和目标掩码的重要性

讨论

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com