发布时间:2025-11-06
点击次数: 美团longcat团队发布了uno-bench,这是一个用于评估多模态大语言模型统一能力的综合性基准测试。
该基准致力于系统化衡量模型在单模态与全模态理解方面的表现,覆盖44种任务类型以及5种不同的模态组合,并通过实验揭示了全模态性能与单模态能力之间的组合规律。

据悉,UNO-Bench包含1250个经过人工精心筛选的全模态样本(跨模态可解性高达98%)和2480个增强型单模态样本。其中,人工构建的数据集更贴近真实应用场景,尤其适用于中文环境;而自动压缩版本则提升了90%的运行效率,在保持与原始数据一致性的前提下,在18项公开基准上实现了98%的结果一致性。除了传统选择题外,团队还提出了一种新颖的多步骤开放式问题形式,以评估模型在复杂推理任务中的表现。这一形式结合了一个通用评分模型,支持对6类题型进行自动化评估,准确率高达95%。

Playground AI
AI图片生成和修图
99
查看详情
目前,UNO-Bench主要聚焦于中文场景,团队正积极寻求合作,推动英语及多语言版本的开发。UNO-Bench数据集已发布于Hugging Face平台,相关代码、论文及项目详情均已开源。
https://www.php.cn/link/455c8959885c1b38871319571e9ab72c
https://www.php.cn/link/36a213dec58f9ae20b81cd14d3358981
https://www.php.cn/link/db17bc578c383f5bb0cb9be70c42331c
以上就是美团 LongCat 发布 UNO-Bench,统一的多模态模型基准测试的详细内容,更多请关注其它相关文章!
# github
# 美团
# 多语言
# 模态
# 多模
# 开源
# 这一
# git
# 赣州网站建设哪家强
# 天津矩阵seo价值
# 灵桥网站推广哪家好
# 无锡网站营销推广是什么
# 印刷网站建设培训
# 永宁网站建设方案
# 杭州百度网站排名优化
# 优化网站优化简历的方法
# 紫金网站优化推广
# 上海网站分站优化排名
# 中文网
# 相关文章
# 这是一个
# 提出了
# 成长之路
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
日媒:AI高效解析纳斯卡地画
改变城市交通:智慧城市中的智能交通
五款 AI 网站构建器,任何人都能快速构建网站
Databricks 发布大数据分析平台 Spark 用 AI 模型 SDK:一键生成 SQL 及 FySpark 语言图表代码
人工智能的变革之路:通过OpenAI的GPT-4漫游
生活垃圾智能分类机器人社区展“才能”,征求居民意见
苹果2万5的AR遭遇砍单95%:不及预期
NVIDIA垄断AI市场90%份额:AMD性能追上80% 软件太不能打
AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲
美图吴欣鸿:希望更多人用上AI时代的影像生产力工具
人工智能大胆预测:银河系至少有2万个地球,36种外星文明
华为发布两款AI存储新品
DeepMind推惊世排序算法,C++库忙更新!
天翼云在国际AI顶会大模型挑战赛中获得冠军
OpenAI已向中国申请注册“GPT-5”商标,此前已在美国提交申请
明略科技发布免费开源TensorBoard.cpp,促进大型模型的预训练工作
加强高质量数据供应能力,促进通用人工智能大模型领域的创新
VMS的应用:提升多品牌设备管理效能
国内通用人形机器人将发布、产业加速突破
拓普龙7188ML:轻便壁挂式工控机箱,为人工智能应用场景提供有力保障
商业智能决策技术助力降本增效,世界人工智能大会举办商业AI高峰论坛
云南首例达芬奇机器人微创心脏手术成功开展
鸿蒙OS 4将实现AI大模型集成,余承东表示坚持AI辅助而非AI取代
标小智LOGO推出AI公司起名生成器“Name.GPT”
美图秀秀“AI 扩图”功能上线,可根据图像生成更大画幅
跑不动的元宇宙,虚拟世界比现实更冷酷
IBM CEO克里希纳:人工智能潜在创新无法被监管
映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动
首个算网生态体!中国移动元宇宙产业联盟正式成立
为什么很多人对纽约《人工智能招聘法》感到生气?
科技数码圈的新物种 乐天派桌面机器人 AI +安卓+机器人 首发价1799元
机器人加速!稀土永磁也被带火,持续性如何?
360发布数字安全和人工智能的强大结合:360安全大模型
从数据中心到发电站:人工智能对能源使用的影响
12页线性代数笔记登GitHub热榜,还获得了Gilbert Strang大神亲笔题词
大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务
微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析
自研4D激光雷达L1 + GPT大语言模型 宇树Unitree Go2四足机器人有啥黑科技?
苹果头显降临,AI虚拟人的救星还是流星?
OpenAI大神Karpathy最新分享:为什么OpenAI内部对AI Agents最感兴趣
360°/180°双模式,佳能公布可折叠小体积的VR全景相机
实践J*a开发,构建高性能的MongoDB数据迁移工具
马斯克称未来机器人数量将多于人类,特斯拉愿共享自动驾驶技术
消息称字节机器人团队已有约50人,计划年底扩充到上百人
Nature封面:量子计算机离实际应用还有两年
RoboNeo安装教程
GPT-4是如何工作的?哈佛教授亲自讲授
官宣!爱康AI未来之夜三大亮点提前剧透!
周鸿祎:360智脑开放API接口 AI大模型将赋能百行千业
世界人工智能大会机器人同台炫技!梳理A股相关业务营收占比超50%的个股名单