发布时间:2024-12-07
点击次数: meta fair 的 yann lecun 团队近期发布了导航世界模型(n*igation world models,nwm),该模型能够基于单张图像生成连续一致的视频,并在已知和未知环境中执行导航和路径规划任务。 这与谷歌 deepmind 的 genie-2 模型类似,但更侧重于导航能力。 nwm 使用一种高效的条件扩散 transformer (cdit) 架构,即使参数量达到10亿,计算需求也相对较小。
NWM 的主要能力体现在以下几个方面:
已知环境轨迹追踪: 基于单张图像和给定的动作序列,NWM 能生成准确的连续视频,展现出良好的场景理解能力。(示例GIF见原文)
未知环境导航: 即使是在训练中从未见过的环境,NWM 也能根据输
入动作预测后续图像帧,实现自主导航。(示例GIF见原文)
路径规划: NWM 可以与外部导航策略(如NoMaD)结合,对生成的轨迹进行评估和排序,选择最佳路径。(示例GIF见原文)
神笔马良
神笔马良 - AI让剧本一键成片。
320
查看详情
与其他模型相比,NWM 在视频一致性、稳定性和动作执行效果方面表现更出色。(示例GIF见原文)
NWM 的核心是其条件扩散 Transformer (CDiT) 架构,通过限制注意力机制并整合交叉注意力层,实现了高效的时间自回归建模。 研究团队在多个机器人导航数据集(如TartanDrive、RECON、HuRoN)上进行了实验,结果表明 NWM 在轨迹预测和导航规划方面达到了先进水平,尤其是在结合外部策略进行轨迹排序时,性能更为突出。 此外,在未标注数据上的训练也提升了 NWM 在未知环境中的泛化能力,尽管仍存在一些局限性,例如在长时间预测中可能出现幻觉。 (具体实验结果和图表请参考原文)
论文链接:https://www.php.cn/link/07193c44ba3be8df1f67e96110c2006e 项目链接:https://www.php.cn/link/ee0f34b734215fee701a993776c2fae4
以上就是LeCun团队新作:在世界模型中导航的详细内容,更多请关注其它相关文章!
# 文档
# 大庆市seo
# 余杭区seo公司
# 虎丘区网站建设企业
# 江苏seo 网络推广
# 上虞建设局网站
# 网站如何营销方案推广
# 无锡seo工作推荐
# 16类容貌关键词排名表
# 杭州品牌营销推广费用
# 口碑seo推广公司
# 见过
# 多个
# 产业
# 韩系
# 发力
# 内测
# 欧洲
# 一键
# 是在
# 充值
# ai
# 谷歌
# nwm
# 世界模型
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?
边喷火边跳踢踏舞,机器狗最新技能爆火全网!网友直呼真·热狗
“可用”“有用”的讯飞星火认知大模型将亮相世界人工智能大会
飒智智能机器人核心技术与应用论坛暨一体化控制器发布会成功举办
水路两栖艇、消防灭火机器人……这个展览“黑科技”抢眼
构建AI绘画网站的方法:使用API接口和调用步骤
【原创】奥比中光:与英伟达合作开发的3D开发套件正式发布 连接英伟达AI应用生态
腾讯AI首次模拟拼接三星堆文物,工作取得阶段性的成果
警惕!AI或致虚假信息泛滥
调查:过半数艺术家认为 AI 作图无法帮助他们的工作
从谷歌到亚马逊,科技巨头们的AI痴迷
OpenAI CEO 山姆・阿尔特曼呼吁 AI 领域中美应当合作
云南首例达芬奇机器人微创心脏手术成功开展
自然语言生成在智能家居设备中的应用
马斯克:将来机器人比人类多!特斯拉机器人亮相人工智能大会
通用医疗人工智能如何革新医疗行业?
意大利警察拟用AI预测犯罪 该算法被指种族歧视严重
成功孵化首个大型模型解决方案的重庆人工智能创新中心
苹果AI战略与微软谷歌大相径庭,到底是领先还是落后?
月薪6万,哪些AI岗位在抢人?
世界人工智能大会高合发表演讲,HiPhi Y即将全球上市
数字文明尼山对话 | 在东方圣城与AI潮流梦幻联动,看“智慧大脑”让数字山东更美好
AI教父Bengio:我感到迷失,对AI担忧已成「精神内耗」!
MIT开发“PhotoGuard”技术保护图像免遭恶意AI编辑
美图公司:Wink国内首发AI画面拓展功能
如何利用AI工具写好本科论文:科技助你一臂之力
AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑
AI室内设计软件流行,室内设计行业如何应对效率变革
特斯拉门店可能启动机器人卖车?也许不是你想的那样
能源电力数字化转型恰逢其时
如何用AI重塑你的工作流(一)
OpenAI已向中国申请注册“GPT-5”商标,此前已在美国提交申请
严打“黑飞”,无人机检测反制设备护航大运会净空安全
国宝级文物“铜兽驮跪坐人顶尊铜像”完成模拟拼接,腾讯AI立功
重塑未来生活的五项技术趋势
GPT-4 模型架构泄露:包含 1.8 万亿参数、采用混合专家模型
人工智能助力精准学习,猿辅导小猿学练机满足学生个性化学习需求
500元一张的AI艺术二维码制作,详细教程来了!
「社交达人」GPT-4!解读表情、揣测心理全都会
绿联发布笑脸屏幕显示充电状态的30W/65W Q湃机器人充电器
特斯拉机器人面世 未来将大幅提振磁材需求,引领人工智能时代
扎克·施奈德新片《月球叛军》曝剧照 机器人首度现身
微软在德国举办MR研讨会,向女性分享元宇宙潜力
拓普龙7188ML:轻便壁挂式工控机箱,为人工智能应用场景提供有力保障
鸿蒙智能座舱的AI大模型革新,引领智能座舱领域的变革吗?
首届全国体育人工智能大会在首都体育学院召开
从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级
AI在教育中的角色:AI如何改变我们的学习方式
学生作文评分的新趋势:教师与AI的合作模式
昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布