400 128 6709

行业新闻

Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿

发布时间:2024-12-01点击次数:

andrej karpathy,openai 创始成员及特斯拉前 ai 高级总监,近日对大型语言模型(llm)的“智能”程度提出了质疑,引发业内热议。他认为,人们对 llm 回答问题的解读过于理想化,将其视为对互联网平均数据标注员的“询问”更为贴切。

Karpathy 指出,LLM 主要通过模仿人工标注数据进行训练。当用户提问(例如,“阿姆斯特丹十大景点”)时,模型实际上是在复现数据标注员曾通过搜索引擎等工具整理出的答案。如果问题不在训练数据集中,模型则会基于预训练阶段(互联网文档语言建模)的知识进行推测。

针对强化学习与人类反馈(RLHF)技术,Karpathy 认为其作用被夸大了。RLHF 并非创造“超越人类”的结果,而是将模型性能从“人工生成”提升到“人工判别”级别。这种提升源于人类对结果的判断更容易于生成结果本身。 LLM 的性能更接近于“人类整体水平”而非个体专家水平,因此所谓的“超人”能力是有限的,真正的“超人”能力需要更高级的强化学习方法,而非 RLHF。

Karpathy 此前已多次批评 RLHF。他以 AlphaGo 为例,指出 RLHF 方法可能导致奖励机制失效,无法实现像 AlphaGo 打败人类世界冠军那样的突破性成果。他认为,LLM 的奖励模型(RM)只是对人类偏好的一种近似,而非解决问题的真正目标。 此外,过度使用 RLHF 还会导致模型学习到一些在人类看来荒谬但 RM 却认为“很棒”的回应。

神笔马良 神笔马良

神笔马良 - AI让剧本一键成片。

神笔马良 320 查看详情 神笔马良

近期,来自 VRAIN 和剑桥大学的研究也佐证了 Karpathy 的观点,指出 LLM 在一些简单任务上表现不佳,甚至会在复杂任务中给出错误答案却不自知。

尽管 LLM 的参数量和训练数据不断增加,性能也在提升,但其基础机制的可靠性仍值得商榷。 目前,OpenAI 提出的基于规则的奖励(RBR)方法或许能为解决 LLM 的“指令遵循”问题提供新的思路,但 LLM 的“智能”本质仍有待进一步探索。

以上就是Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿的详细内容,更多请关注其它相关文章!


# rlhf  # 全网精准营销推广工具  # 江西网站优化推广外包  # 海南网站优化设计公司  # seo上首页费用  # 合作怎么做网站推广  # 美丽网站建设工作  # 乐山seo费用  # 剑桥大学  # 一言  # 文档  # 生命科学  # 解决问题  # 不存在  # 多家  # 互联网  # 而非  # 自定义  # ai  # 理论  # 预约福州seo报价平台  # 信阳智能seo推广招聘  # 建设网站优化哪个好 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 热点 | 人工智能黄金时代开启  DreamAvatar数字人在哪里下载  苹果AR头显商标与华为撞车,在中国或改名  类GPT模型训练提速26.5%,清华朱军等人用INT4算法加速神经网络训练  2025智源大会AI安全话题备受关注,《人机对齐》新书首发  值得买科技入选“北京市通用人工智能产业创新伙伴计划”应用伙伴  《自然》杂志拒绝刊登人工智能生成的图片和视频  选对AI智能写作软件,让创作游刃有余!  苹果2万5的AR遭遇砍单95%:不及预期  沐曦首款AI推理GPU亮相:INT8算力达160TOPS!  梦想实现!硬核科幻大片VR智能头盔即将问世  13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了  今年,全球客服中心支出将增长 16.2%,迎接对话式 AI 的浪潮,根据 Gartner 报告  如何提高集群协作效率?中外团队合作研发基于均值偏移的机器人队形控制策略  腾讯汤道生:大模型只是起点,产业落地是AI更大的应用场景  电池比 Air 2S 大 20%,大疆 Air 3 无人机现身 FCC  人工智能在交通领域的革新:智能解决方案彻底改变交通方式  AI框架生态峰会本周开幕 华为昇腾“朋友圈”再聚首 全球首个全模态大模型将登场  AMD在AI方面奋起直追,与英伟达的差距缩小了吗?  朱民:普通人炒股炒不过机器人是很正常的 AI已经能理解市场情绪  大疆 DJI Mini 4 Pro 无人机曝光:流线设计,有望迎来功能性提升  从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级  XREAL发布新款硬件XREAL Beam投屏盒子:可悬停AR空间屏  微软新出热乎论文:Transformer扩展到10亿token  微软Bing聊天机器人电脑端即将支持语音提问  AI技术加速迭代:周鸿祎视角下的大模型战略  科技赋能司法执行 阿里资产免费为全国法院升级VR新服务  华为云天筹AI求解器荣获世界人工智能大会最高奖  商业智能决策技术助力降本增效,世界人工智能大会举办商业AI高峰论坛  智能机器人与话剧的完美结合:宇树四足机器人B1助力《骆驼祥子》重现经典  洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!  清华&中国气象局大模型登Nature:解决世界级难题,「鬼天气」预报时效首次达3小时  曝索尼在开发新头显设备:游戏中使用AR技术  昌吉市利用无人机实现全天候河道动态巡检  报告称 70% 程序员已使用各种 AI 工具编程  IBM将模拟计算用于人工智能,重塑AI计算  不到2S创作AI图像!Snap发布图像生成器SnapFusion  Valve 将拒绝采用 AI 生成未知版权内容的游戏上架 Steam  兆讯传媒率先全面拥抱AI 数智广告内容焕发新生机  电力人工智能数据集目录首次发布  Bing Chat 和 Bing Search 正式引入深色模式  AI时代,企业需要什么样的员工?  杭州举办第19届亚运会,主题为「亚运元宇宙」的发布仪式举行  2025年的网络分区:人工智能和自动化如何改变事物  「从未被制造出的最重要机器」,艾伦·图灵及图灵机那些事  清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳  人工智能在商业中的风险和局限性  人工智能产业竞跑“未来赛道” 创新发展放大“赋能”效应  高通发布长期产品计划,为工业和企业物联网产品提供全新组合方案  聚焦WAIC|AI技术支撑大模型探索未来 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司