400 128 6709

行业新闻

神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊

发布时间:2024-07-23点击次数:

这是人类首次证明神经网络可以创建自己的地图。想象一下,你身处一个陌生的小镇,即使一开始周围的环境并不熟悉,你也可以四处探索,并最终在大脑中绘制出一张环境地图,里面包含建筑物、街道、标志等相互之间的位置关系。这种在大脑中构建空间地图的能力是人类更高级认知类型的基础:例如,有理论认为,语言是由大脑中类似地图的结构编码的。然而, 即使是最先进的人工智能和神经网络,也无法凭空构建这样的地图。 计算生物学助理教授、heritage medical 研究所研究员 matt thomson 说:「有一种感觉是,即使是最先进的人工智能模型,也不是真正的智能。它们不能像我们一样解决问题;不能证明未经证实的数学结果,也不能产生新的想法。」「我们认为,这是因为它们无法在概念空间中导航;解决复杂问题就像在概念空间中移动,就像导航一样。人工智能做的更像是死记硬背 —— 你给它一个输入,它给你一个回应。但它无法综合不同的想法。」 最近,thomson 实验室的一篇新论文发现,神经网络可以使用一种叫做「预测编码」的算法来构建空间地图 。该论文于 7 月 18 日发表在《自然 - 机器智能》(nature machine intelligence)杂志上。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

神经网络也有空间意识!学会在minecraft创建地图,登上nature子刊

1. 论文地址:https://www.nature.com/articles/s42256-024-00863-1
  1. 代码地址:https://github.com/jgornet/predictive-coding-recovers-maps

研究生 James Gornet 带领团队在《我的世界》(Minecraft)中构建了环境,融入复杂元素(如树木、河流、洞穴)。他们录制了玩家随机穿越该区域的视频,并利用视频训练了一个配备预测编码算法的神经网络。

研究发现,神经网络学习了 Minecraft 世界中物体的组织方式,并能「预测」玩家在空间中移动时会遇到的环境。

神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊

预测编码算法与 Minecraft 游戏的结合成功地「教会」了神经网络如何创建空间地图,并随后使用这些空间地图来预测视频的后续帧,结果预测图像与最终图像之间的均方误差仅为 0.094%。

更重要的是,研究小组「打开」了神经网络(相当于检查内部结构),发现各种物体的表征是相对于彼此进行空间存储的。换句话说,他们看到了存储在神经网络中的 Minecraft 环境地图。

神经网络可以导航人类设计者提供给它们的地图,例如使用 GPS 的自动驾驶汽车,但这是人类首次证明神经网络可以创建自己的地图。这种在空间上存储和组织信息的能力最终将帮助神经网络变得更加「聪明」,使它们能够像人类一样解决真正复杂的问题。

这个项目展示了人工智能真正的空间感知能力,而这在 OpenAI 的 Sora 等技术中仍然看不到,后者存在一些奇怪的故障。

James Gornet 是加州理工学院计算与神经系统(CNS)系的学生,该系涵盖神经科学、机器学习、数学、统计学和生物学。

「CNS 项目确实为 James 提供了一个地方,让他从事其他地方不可能完成的独特工作,」Thomson 说。「我们正在采用一种生物启发的机器学习方法,让我们能够在人工神经网络中反向设计大脑的特性,我们希望反过来了解大脑。在加州理工学院,我们有一个非常容易接受这类工作的社区。」

执行预测编码的神经网络

受预测编码推理问题中隐式空间表示的启发,研究者开发了一个预测编码智能体的计算实现,并研究了该智能体在探索虚拟环境时学习到的空间表示。

码上飞 码上飞

码上飞(CodeFlying) 是一款AI自动化开发平台,通过自然语言描述即可自动生成完整应用程序。

码上飞 430 查看详情 码上飞

他们首先使用 Minecraft 中的 Malmo 环境创建了一个环境。物理环境的尺寸为 40 × 65 格单位,囊括了视觉场景的三个方面:一个山洞提供了一个全局视觉地标,一片森林使得视觉场景之间具有相似性,而一条带有桥梁的河流则限制了智能体如何穿越环境(图 1a)。

神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊

1. 智能体遵循路径,路径由 A* 搜索确定,以找到随机取样位置之间的最短路径,并接收每条路径上的视觉图像。
  1. 为了进行预测编码,作者构建了一个编码器 - 解码器卷积神经网络,编码器采用 ResNet-18 架构,解码器采用转置卷积的 ResNet-18 架构(图 1b)。编码器 - 解码器架构使用 U-Net 架构将编码的潜在单元传递到解码器中。
  2. 多头注意力处理编码潜在单元序列,以编码过去的视觉观察历史。多头注意力有 h = 8 个头。对于维度为 D = C × H × W 的编码潜在单元,在高度 H、宽度 W 和通道 C 的情况下,单个头部的维度为 d = C × H × W/h。

    神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊

    预测编码器采用均方误差最小化策略,拟合预测观测值与真实观测值之间的差异。

训练详情:

  • 样本数量:82,630
  • 轮次:200
  • 优化器:Nesterov 动量梯度下降
  • 权重衰减:5 × 10^(-6)
  • 初始学习率:10^(-1)
  • 学习率调度:OneCycle

训练后,预测编码器达到良好的视觉保真度,预测图像与真实图像之间的均方误差为 0.094(如图 1c 所示)。

神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊

更多细节请参见原论文。

参考链接:

https://techxplore.com/news/2025-07-neural-network-minecraft.html

https://www.tomshardware.com/tech-industry/artificial-intelligence/neural-network-learns-to-make-maps-with-minecraft-code-*ailable-on-github

以上就是神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊的详细内容,更多请关注其它相关文章!


# 产业  # 网站首页优化公司怎么做  # 邵阳网站开发怎么推广  # 黑mao seo  # 浙江SEO优化效果好  # 美团营销推广怎么操作流程  # 清远网络推广和营销  # 即使是  # 翻倍  # 首次  # 就像  # 加州  # 脑中  # 自己的  # 省电  # 会在  # 也有  # sora  # 我的世界  # git  # 神经网络  # 舞钢橡胶助剂网站建设  # 滨州国内网络营销推广  # 深圳优化推广产品营销  # 宜阳微网站建设 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: Yann LeCun团队新研究成果:对自监督学习逆向工程,原来聚类是这样实现的  到中国科技馆体验“一滴油的奇妙旅行”,线上元宇宙展厅同步开启  优地网络助力新媒体拥抱人工智能时代  苹果CEO库克:持续研究生成式人工智能技术  马斯克:将来机器人比人类多!特斯拉机器人亮相人工智能大会  你们的开机第一屏画面要变了!安卓机器人首次3D化  OpenOOD更新v1.5:全面、精确的分布外检测代码库及测试平台,支持在线排行榜、一键测试  组建团队,字节跳动要造机器人?  京东 AI 大模型官宣 7 月 13 日发布,还有重磅合作  技术如何使人变得懒惰?  世界人工智能大会机器人同台炫技!梳理A股相关业务营收占比超50%的个股名单  苹果推出全新沉浸式 AR 体验应用“Deep Field”  机构研选 | 虚拟电厂是电力物联网升级版 智能电网望迎来高速发展  Meta Connect 2025已确定时间为9月27-28,主题涵盖Quest 3与AI技术  美图设计室2.0使用教程  “五年内人类程序员将消失”预言引争议,AI真的那么强大了吗?  上海发布大模型政策 打造AI“模”都  人工智能写作检测工具不靠谱,美国宪法竟被认为是机器人写的  全新升级的广州麦当劳:面积最大餐厅正式引入智慧机器人  学生作文评分的新趋势:教师与AI的合作模式  社区里,孩子们体验“机器人竞技”  AI室内设计软件流行,室内设计行业如何应对效率变革  管提需求,大模型解决问题:图表处理神器SheetCopilot上线  马斯克反讽人工智能AI炒作:“机器学习”本质就是统计  成都大运会闭幕式引入人形机器人展示表演  埃森哲俞毅:AI时代我们需要新的“摩尔定律”  人工智能驱动艺术,打开达利的超现实想象  人工智能和你聊天 成本有多高  构建人机交互创新模式,微美全息研究AIGC智能交互界面生成技术  生成式AI引路产业加速来袭,微美全息探索“AIGC+虚拟人”融合应用  笔神作文声讨学而思AI大模型 称用“爬虫”技术盗取数据  人工智能在交通领域的革新:智能解决方案彻底改变交通方式  甲骨文与Cohere合作为企业提供生成式人工智能服务  GPT-4是如何工作的?哈佛教授亲自讲授  “世界上最像人的机器人”接入 Stable Diffusion ,现场完成作画  击败LLaMA?史上超强「猎鹰」排行存疑,符尧7行代码亲测,LeCun转赞  这款在《自然通讯》发表的机器人,为变形金刚来到现实创造可能性  第四范式“式说”大模型入选《2025年通用人工智能创新应用案例集》  微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课  开创全新虚拟现实体验的Pimax Crystal VR头显  用人工智能技术,亚马逊为用户生成产品评论摘要,帮助他们轻松选购  微软和谷歌面临的人工智能困境:需要投入大量资金才能获得盈利  首个算网生态体!中国移动元宇宙产业联盟正式成立  MiracleVision视觉大模型  实践J*a开发,构建高性能的MongoDB数据迁移工具  AI证件照生成器:实际测试中AI软件展现了绝无仅有的强大效能  大脚攀爬者车主福利!无人机、运动相机大奖等你来挑战  英伟达首席执行官黄仁勋:生成式 AI 时代「人类」会是新的编程语言  “思享荟”沙龙热议AIGC与元宇宙 复旦大学赵星畅谈深度数字化  AI大模型火了!科技巨头纷纷加入,多地政策加码加速落地 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司