400 128 6709

行业新闻

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

发布时间:2024-12-19点击次数:

斯坦福大学研究团队提出全新多模态语言模型,实现逼真3d人体动作生成与理解。该模型突破性地整合了语音、文本和动作三种模态,能够根据语音和文本指令生成自然流畅的动作,并支持动作编辑。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

模型架构图

研究人员指出,利用语言模型统一人类动作的言语和非言语表达至关重要,因为它能自然地与其他模态连接,并具备强大的语义推理和理解能力。 该模型采用两阶段训练:首先进行预训练,对齐不同模态,然后进行下游任务训练,使其遵循各种指令。

预训练流程图

该模型将动作分解为面部、手部、上半身和下半身等不同部位进行token化,再结合文本和语音token化策略,实现多模态输入的统一表示。预训练阶段包含组合动作对齐(空间和时间)和音频-文本对齐两种任务,以学习动作的时空先验和模态间关联。

空间动作对齐示例

时间动作对齐示例

Tunee AI Tunee AI

新一代AI音乐智能体

Tunee AI 1104 查看详情 Tunee AI

实验结果表明,该模型在伴语手势生成等任务上超越现有SOTA模型,尤其在数据稀缺的情况下优势显著。 它能够根据语音和文本指令生成协调一致的动作,并支持将“绕圈走”等动作替换为其他动作序列,保持动作的自然流畅。

与其他模型效果对比

与其他模型效果对比

此外,该模型还展现了出色的泛化能力和在动作情绪预测任务中的潜力。这项研究为李飞飞教授的“空间智能”研究目标做出了重要贡献。

  • 论文标题:The Language of Motion: Unifying Verbal and Non-verbal Language of 3D Human Motion
  • 论文地址:https://www.php.cn/link/c5b3966bd2d4c690da368b3ecbece868
  • 项目页面:https://www.php.cn/link/f9ab9a0f7c56435e35dc4dadf0eb6945

以上就是李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪的详细内容,更多请关注其它相关文章!


# 李飞飞  # 东莞地坪网站建设推广  # 辽宁实力强的seo推广  # web网站移动端优化  # seo 外链作用  # 黄浦网站建设推广公司  # 怎么优化英语网站  # 嘉兴seo搜索栏项目  # 文档  # 读懂  # 斯坦福大学  # 内测  # 与其他  # 生命科学  # 多家  # 还能  # 模态  # 多模  # yy  # git  # 空间智能  # 产业  # 网站推广优化哪个平台好  # 商丘网站建设系统哪个好  # 三沙抖音seo 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 全新升级的广州麦当劳:面积最大餐厅正式引入智慧机器人  东软成立魔形科技研究院,积极布局大语言模型系统工程战略,迎接AI时代  微软Xbox称VR和AR还需要时间 先玩大的  AI拉动PCB发展|行业发现  谷歌推出 AI 反洗钱工具,可将金融机构内部风险预警准确率提高2至4倍  机器人 展才能  云米Smart 2E AI立式空调开启预售:新三级能效,到手价3899元  看似低调,实则稳健:字节在AI路上会遇到什么?  猿辅导发布最新SaaS业务进展公告:Motiff UI设计工具推出三项新的AI功能  沐曦首款AI推理GPU亮相:INT8算力达160TOPS!  随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了  学而思网校推出首个基于自研大模型的《人工智能第一课》  V社悄悄封禁使用AI生成美术素材的游戏  物联网“僵尸网络DDos攻击”增长惊人,威胁全球电信网络  如何成功实施人工智能?  “风乌”气象大模型科学家团队:用AI预报极端天气未来不是梦!  洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!  智能机器人与话剧的完美结合:宇树四足机器人B1助力《骆驼祥子》重现经典  “木头姐”:特斯拉的人工智能训练——“赢家通吃”的机会  击败LLaMA?史上超强「猎鹰」排行存疑,符尧7行代码亲测,LeCun转赞  九号公司主导制定短途交通和送物机器人领域首个国际标准,标志着零的突破发布  人工智能自己玩自己  AI无法对传统文化符号进行解构和创新  调研海尔智家:AI名,家电命?  如何提高集群协作效率?中外团队合作研发基于均值偏移的机器人队形控制策略  世界周刊丨AI“棱镜”?  大模型的“黄金搭档”来了!腾讯云正式发布AI原生向量数据库,提供10亿级向量检索能力  放弃自动驾驶,也是一种和解  通用医疗人工智能如何革新医疗行业?  AYANEO AIR 1S 掌机发布:R7 7840U,预订价 4699 元起  探索人工智能在物联网领域的影响与改变  阿里云AI绘画创作大模型通义万相发布 已开启定向邀测  普林斯顿大学推出 Infinigen AI 模型,生成真实自然环境 3D 场景  小艺将具备大模型能力,鸿蒙4加速AI普及之路  华为HarmonyOS 4将集|成人|工智能大型模型  三个全球首创,青岛西海岸新区“海元宇宙”亮相世界人工智能大会  消息称 Meta Quest 将推 VR 游戏订阅:每月 7.99 美元,任选两款  央广车联网亮相2025世界人工智能大会  鸿蒙智能座舱的AI大模型革新,引领智能座舱领域的变革吗?  面向AI大模型,腾讯云首次完整披露自研星脉高性能计算网络  人工智能颠覆软件测试四大方式  阿里达摩院向公众免费开放100项AI专利许可  石头扫拖机器人 G20 618 福利来袭:4999 元,超值配件领到手软  创新科学家成功研发FAST激光靶标维护机器人  探索AI前沿理念 2025全球人工智能技术大会在杭州开幕  人工智能助力林草行业高质量发展  500元一张的AI艺术二维码制作,详细教程来了!  VR健身应用《FitXR》将取消Quest 1端会员服务  大模型训练成本降低近一半!新加坡国立大学最新优化器已投入使用  OpenAI限制网络爬虫访问以保护数据免被用于AI模型训练 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司