400 128 6709

行业新闻

美团 LongCat 发布 UNO-Bench,统一的多模态模型基准测试

发布时间:2025-11-06点击次数:

美团longcat团队发布了uno-bench,这是一个用于评估多模态大语言模型统一能力的综合性基准测试。

该基准致力于系统化衡量模型在单模态与全模态理解方面的表现,覆盖44种任务类型以及5种不同的模态组合,并通过实验揭示了全模态性能与单模态能力之间的组合规律。

美团 LongCat 发布 UNO-Bench,统一的多模态模型基准测试

据悉,UNO-Bench包含1250个经过人工精心筛选的全模态样本(跨模态可解性高达98%)和2480个增强型单模态样本。其中,人工构建的数据集更贴近真实应用场景,尤其适用于中文环境;而自动压缩版本则提升了90%的运行效率,在保持与原始数据一致性的前提下,在18项公开基准上实现了98%的结果一致性。除了传统选择题外,团队还提出了一种新颖的多步骤开放式问题形式,以评估模型在复杂推理任务中的表现。这一形式结合了一个通用评分模型,支持对6类题型进行自动化评估,准确率高达95%。

美团 LongCat 发布 UNO-Bench,统一的多模态模型基准测试

Playground AI Playground AI

AI图片生成和修图

Playground AI 99 查看详情 Playground AI

目前,UNO-Bench主要聚焦于中文场景,团队正积极寻求合作,推动英语及多语言版本的开发。UNO-Bench数据集已发布于Hugging Face平台,相关代码、论文及项目详情均已开源。

https://www.php.cn/link/455c8959885c1b38871319571e9ab72c
https://www.php.cn/link/36a213dec58f9ae20b81cd14d3358981
https://www.php.cn/link/db17bc578c383f5bb0cb9be70c42331c

以上就是美团 LongCat 发布 UNO-Bench,统一的多模态模型基准测试的详细内容,更多请关注其它相关文章!


# github  # 美团  # 多语言  # 模态  # 多模  # 开源  # 这一  # git  # 赣州网站建设哪家强  # 天津矩阵seo价值  # 灵桥网站推广哪家好  # 无锡网站营销推广是什么  # 印刷网站建设培训  # 永宁网站建设方案  # 杭州百度网站排名优化  # 优化网站优化简历的方法  # 紫金网站优化推广  # 上海网站分站优化排名  # 中文网  # 相关文章  # 这是一个  # 提出了  # 成长之路 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: ​日媒:AI高效解析纳斯卡地画  改变城市交通:智慧城市中的智能交通  五款 AI 网站构建器,任何人都能快速构建网站  Databricks 发布大数据分析平台 Spark 用 AI 模型 SDK:一键生成 SQL 及 FySpark 语言图表代码  人工智能的变革之路:通过OpenAI的GPT-4漫游  生活垃圾智能分类机器人社区展“才能”,征求居民意见  苹果2万5的AR遭遇砍单95%:不及预期  NVIDIA垄断AI市场90%份额:AMD性能追上80% 软件太不能打  AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲  美图吴欣鸿:希望更多人用上AI时代的影像生产力工具  人工智能大胆预测:银河系至少有2万个地球,36种外星文明  华为发布两款AI存储新品  DeepMind推惊世排序算法,C++库忙更新!  天翼云在国际AI顶会大模型挑战赛中获得冠军  OpenAI已向中国申请注册“GPT-5”商标,此前已在美国提交申请  明略科技发布免费开源TensorBoard.cpp,促进大型模型的预训练工作  加强高质量数据供应能力,促进通用人工智能大模型领域的创新  VMS的应用:提升多品牌设备管理效能  国内通用人形机器人将发布、产业加速突破  拓普龙7188ML:轻便壁挂式工控机箱,为人工智能应用场景提供有力保障  商业智能决策技术助力降本增效,世界人工智能大会举办商业AI高峰论坛  云南首例达芬奇机器人微创心脏手术成功开展  鸿蒙OS 4将实现AI大模型集成,余承东表示坚持AI辅助而非AI取代  标小智LOGO推出AI公司起名生成器“Name.GPT”  美图秀秀“AI 扩图”功能上线,可根据图像生成更大画幅  跑不动的元宇宙,虚拟世界比现实更冷酷  IBM CEO克里希纳:人工智能潜在创新无法被监管  映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动  首个算网生态体!中国移动元宇宙产业联盟正式成立  为什么很多人对纽约《人工智能招聘法》感到生气?  科技数码圈的新物种 乐天派桌面机器人 AI +安卓+机器人 首发价1799元  机器人加速!稀土永磁也被带火,持续性如何?  360发布数字安全和人工智能的强大结合:360安全大模型  从数据中心到发电站:人工智能对能源使用的影响  12页线性代数笔记登GitHub热榜,还获得了Gilbert Strang大神亲笔题词  大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务  微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析  自研4D激光雷达L1 + GPT大语言模型 宇树Unitree Go2四足机器人有啥黑科技?  苹果头显降临,AI虚拟人的救星还是流星?  OpenAI大神Karpathy最新分享:为什么OpenAI内部对AI Agents最感兴趣  360°/180°双模式,佳能公布可折叠小体积的VR全景相机  实践J*a开发,构建高性能的MongoDB数据迁移工具  马斯克称未来机器人数量将多于人类,特斯拉愿共享自动驾驶技术  消息称字节机器人团队已有约50人,计划年底扩充到上百人  Nature封面:量子计算机离实际应用还有两年  RoboNeo安装教程  GPT-4是如何工作的?哈佛教授亲自讲授  官宣!爱康AI未来之夜三大亮点提前剧透!  周鸿祎:360智脑开放API接口 AI大模型将赋能百行千业  世界人工智能大会机器人同台炫技!梳理A股相关业务营收占比超50%的个股名单 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司