发布时间:2025-12-03
点击次数: 又到年末复盘季啦!本文将带大家回顾我所在团队今年在大模型领域的技术演进路径与落地实践。
大模型的爆发,催生了众多实用型AI应用,其中最主流、最贴近业务场景的当属 RAG(Retrieval-Augmented Generation,检索增强生成)。然而,在短短不到三年时间里,RAG 在技术圈经历了数次“沉浮”:
——刚被寄予厚望,转眼就被预言将被 GraphRAG 取代;
——还没站稳脚跟,又被称“大模型原生能力已覆盖 RAG”;
——长上下文风头正盛时,RAG 被断言“即将退场”;
——紧接着上下文工程又成新宠……
最近 DeepSeek-OCR 的发布,更引发了业内对当前纯文本驱动的 RAG 架构是否仍具可持续性的深度反思。
但就我们一线落地经验来看,RAG 依然是当前企业级大模型应用中不可替代的底层能力。与此同时,我们也越来越清晰地意识到:仅靠传统 RAG 已远远无法应对日益复杂的用户需求。本文将系统介绍我们如何从基础 RAG 出发,逐步迈向更智能、更自主的 DeepResearch 技术体系。
话不多说,先看整体技术演进图谱:
descript1. RAG知识库检索大模型底座的研发门槛极高,在绝大多数 AI 项目中,团队更务实的选择是:如何高效、稳定地用好现有大模型。
这自然将优化重心聚焦于两个关键环节:
输入优化:即 Prompt 工程 / 上下文工程;
输出治理:确保大模型输出更精准、更可控、更符合业务预期。
暂且抛开 Agent 框架中的规划、工具调用、记忆与反思等高级能力,单看单轮问答这一最基础交互形态——无论叫 Prompt Engineering 还是 Context Engineering,本质都是同一个问题:我们该给大模型喂什么内容,它才能真正理解意图,并给出高质量答案?
通用知识,大模型已基本掌握;但要让它懂“你的业务逻辑”,答出“你关心的问题”,就必须构建专属的知识资产,并通过 RAG 实现精准注入。换言之,RAG 就是最直接、最有效的输入增强手段。
关于 RAG 的基础原理与实现细节,我在过往多篇文档中已有详述,此处不再赘述。
(RAG,真是让我们熬过不少通宵……模型不是“降智”就是“幻觉”,RAG 往往成了背锅侠)
结合我们在打造企业级 RAG 知识库问答平台过程中的实战体会:召回、检索、大模型生成等核心模块的技术方案已相对成熟。但在真实落地阶段,算法团队面临的挑战早已远超模型本身——数据质量、治理标准、工程链路稳定性,甚至原始数据的完整性,都可能成为瓶颈。
尤其在垂直领域,我们仍需基于行业特有数据开展模型微调与定制化优化,并针对性攻克实际问题。例如:
关键能力模块如下图所示:
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
descript再分享几点 RAG 落地过程中的关键认知:
管理层的战略定力:企业真正迈向 AI 原生,首要前提是推动数据入口统一、治理流程标准化,而这离不开高层的坚定支持与资源投入。
跨职能协同机制:从业务需求梳理、非结构化数据清洗、语义结构重构、文档规范制定,到版面解析、向量化入库等环节,前期必须由算法与业务团队高频对齐、深度共建。
持续迭代思维:切勿幻想“一次治理、永久可用”。RAG 平台的效果提升,本质上是一场贯穿全生命周期的数据+算法共进化过程——每一次上线、每一条用户反馈,都是打磨知识体系与模型能力的宝贵契机。
RAG 的引入,不只是让企业“用上 AI”,更是触发其启动数据资产化治理、知识图谱化重构的关键起点。而 RAG 自身,也在真实业务压力下不断进化:变得更稳健、更聪明,也更适配多样化业务诉求。
RAG 是知识库问答的标配能力,但在用户真实提问中,我们发现大量问题既不在预置模型能力范围内,也不在内部知识库中,而是强依赖实时网络信息,比如:“最近武汉有哪些热门演唱会?”——这类用户,我们当然不能放弃。
因此,我们构建了一套实时 Web 检索能力,将互联网作为动态知识源,使模型可在必要时按需获取最新资讯。从架构角度看,只需在原有 RAG 流程中新增一个外部检索通道,无需重构主链路。
既然“搜”已打通,那“推”岂能缺席?我们顺势开发了每日热点文章 & 最新顶会论文自动抓取与摘要生成模块,大幅减少人工信息筛选成本。没想到该功能上线后迅速在多个技术团队走红——在信息爆炸时代,AI 主动识别并推送高价值内容,才是真正体现其生产力价值的时刻。
下图是我们为算法同事每日推送的 AI 行业前沿简报界面。该机制并不局限于技术领域,任务类型可根据不同业务线灵活配置。
descript同时,这套 Web 检索结果可无缝接入 RAG 流程,直接支持与网页内容的深度问答交互。
随着工具能力持续丰富、平台使用规模稳步增长,我们愈发明确一个事实:仅具备基础“检索”能力的 RAG 系统,已难以支撑更高阶的业务诉求。
当信息源愈加多元、问题愈加复杂,“单次检索 + 浅层推理”的范式极易止步于表层答案。为此,我们开始向纵深突破——正式开启深度检索(Deep Search)能力建设。
这并非我们独有的挑战,而是整个 RAG 应用生态正在共同演进的方向,如通义 DeepResearch Agent 即为代表性探索之一。
Deep Research Agent技术 --通义“狐獴家族”(一)
综合论文方法论、真实场景暴露的短板,以及内部知识库与外部 Web 检索双轨并行的实际需求,我们完成了一套私有化部署的深度检索系统:
Android手机开发课程标准 中文WORD版
本课程在设计上本着懂方法,重应用的总体思路,突出体现职业教育的技能型、应用性特色,着重培养学生的实践应用技能,力求达到理论方法够用,技术技能过硬的目的。 通过本课程的学习,使学生具备Android平台应用开发相关知识、良好的编程习惯和手机应用软件开发的能力,能胜任基于Android平台的手机软件研发等工作任务。感兴趣的朋友可以过来看看
0
查看详情
深度检索通常面向具体问题,输出以精炼回答为主。但随着技术成熟与用户期待升级,需求已悄然跃迁至更高层级:“请 AI 独立开展系统性研究,并交付一份结构清晰、逻辑严密、图文并茂的深度研究报告。”
Deep Research Agent技术 --通义“狐獴家族”(二)
前两篇文章中,我已系统阐述了从 RAG → 深度检索 → 深度研究报告的技术跃迁路径,本文不再重复技术细节,基础流程可参考图一框架中的对应模块:
descript本文重点聚焦于:通用 DeepResearch 方案与企业级落地之间的关键差异,以及我们为何选择自研整套 DeepResearch Agent。
目前,我们自研的 DeepResearch Agent 已在 DeepResearch_Bench 官方评测榜单中,采用标准测评方式验证,性能稳居前三,超越第三名。
descript
descript核心突破体现在以下五方面:
(1)多智能体协同架构
依据图一模块划分,完整的 DeepResearch 流程需多个专业化 Agent 模块与工具链协同运作,从而保障最终输出的专业性、系统性与可控性。
(2)自研 Query 扩展模型,拓展研究广度与维度
针对真实业务中普遍存在的指代模糊、问题漂移、语义窄化等 Query 理解难题,我们基于高质量多维标注数据集,对 7B 规模模型开展 SFT + RLHF 训练。实测效果已与开源 32B 模型持平,实现小模型、高性价比的工程落地目标。
(3)自研 Deep Search 搜索引擎
深度融合自研 Web 检索工具与多跳推理框架,大幅提升复杂主题下的信息挖掘与跨源整合能力,使模型更擅长链式推理与证据闭环构建。
(4)全链路性能优化体系
为保障在企业环境中真正可用、可扩、可运维,我们开展了系统级性能攻坚:
(5)多模态能力原生集成
当前主流开源 DeepResearch 方案普遍缺乏多模态支持,而我们在 RAG 项目中已构建完整图文理解与检索能力,得以平滑迁移至 DeepResearch 全流程。
此外,在真实企业场景中,我们观察到各业务线对 DeepResearch 的诉求差异极大,例如:
属报告模板; 这些需求,远超现有开源框架的默认能力边界。因此,我们在自研 DeepResearch Agent 架构基础上,投入大量工程化建设,将其打磨为真正可交付、可配置、可运维的企业级产品方案。
descript在工程能力上,我们还通过 AI Coding 模块实现了“一键生成 HTML 可视化报告”的能力,让研究成果可快速发布与共享。
descript同时上线在线画布功能,支持业务人员与 AI 直接交互、实时调整报告结构与内容。
descript5. 多模态多模态方向,我们的技术探索聚焦三大核心能力:多模态理解、多模态生成、多模态推理加速。
本文主线围绕 RAG → DeepResearch Agent 全流程展开,当前企业在该链条中最常用、最刚需的能力,仍是多模态理解。
其中,版面分析是 RAG 流程中至关重要却常被低估的一环。文档解析的质量,直接决定后续文本切片合理性、检索准确性与最终回复质量。我们在此环节历经多轮技术迭代:
实践表明,没有“银弹”方案。不同业务的数据分布特征、延迟容忍度、算力预算均不同,需按场景择优选型。
完成版面分析后,下一步是对文档中图像内容进行深度理解与处理。
我们在 RAG 中构建的图文检索与生成链路包括:
最终交付的是兼具信息密度与视觉表达力的多模态回复。
6. Agent如果说 RAG 解决的是“让模型知道该看什么”,赋予其记忆;
DeepSearch 解决的是“让模型知道该怎么看”,赋予其思考;
DeepResearch 解决的是“让模型能把看过的内容系统性组织起来”,赋予其研究能力;
那么 Agent 要解决的,就是“让模型自主判断下一步该做什么”,赋予其执行力。
当我们沿着 RAG → 联网检索 → 深度搜索 → 深度研究这条路径持续演进,技术走向已愈发清晰:从“被动回答问题”,正加速迈向“主动完成任务”。
即便不刻意对标 Agent 框架,产品为满足真实业务需求,也必然自发演化出 Agent 特性——它需要理解用户意图、感知环境变化、调用合适工具、执行推理研究,并交付端到端解决方案。
当然,在企业实践中,算法只是拼图一角。哪怕仅从纯技术视角出发,AI 从来都不是单一模型或框架,而是一整套涵盖数据、算法、工程、运维的复合型技术体系。
在 RAG → 深度检索 → DeepResearch → Agent 的建设过程中,除算法研发外,我们同步构建了完整的工程底座:包括弹性算力平台、标准化中间件、工具链生态、全链路可观测性、并发调度引擎、缓存机制及运营数据大盘等。
回看去年的技术文章,更多聚焦于理论探讨与方法论沉淀;而今年,团队已在深度报告 Agent 方向实现规模化场景落地,完整走通了从 RAG 到 Agent 的技术闭环:
总体而言,企业大模型落地绝非仅靠几个先进模型即可达成,而是一项横跨业务理解、知识管理、数据治理、算法研发、工程实现与性能优化的系统工程。RAG 是不可或缺的起点,但唯有叠加深度检索、深度研究与 Agent 化能力,才能真正释放 AI 的决策智能与生产力价值。
朗新AI研究院已在多个关键技术方向形成深厚积累,成功孵化出一系列面向集团内部业务场景的智能体应用。
其中,深度研究报告系统、“产品博士”与“售前专家”等核心智能体,均深度集成了本文所述的 DeepResearch 技术能力。

以上就是RAG到DeepResearch技术路线实践的详细内容,更多请关注其它相关文章!
# html
# 工具
# ai
# 搜索引擎
# 数据清洗
# 大模型
# 金球奖
# seo服务哪家便宜
# 课程标准
# 东晓高端网站建设
# 阳明街道外贸网站建设
# 太原seo接单
# 抖音营销推广哪家好
# 制作一份营销推广方案
# 邹平外贸网站推广方法
# 宁波小型网站建设公司
# 广州seo电子如何
# 南山区网站推广价格实惠
# 闭环
# 重构
# 研究报告
# 文档
# 多个
# 链路
# 的是
# 多模
# deep search
# descript
# deepseek
# 热点
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
让AI助手带您轻松愉快地享受写作之旅
人工智能在商业中的风险和局限性
聚焦人工智能大模型、AIGC 徐汇十余场重磅论坛等你来
五个IntelliJ IDEA插件,高效编写代码
配 3D 机器人头像,谷歌展示全新安卓 LOGO
苹果式 AI 哲学:不着一字,处处落子
宇宙探索下一阶段,机器代替人类,AI会在太空探索中取代人类吗?
谷歌新安卓机器人logo曝光:头更大了
出门问问亮相2025世界人工智能大会,展示AI CoPilot解决方案
世界人工智能大会|“AI领航,共筑未来”高端保险论坛成功举办
华为推出两款商用 AI 大模型存储新品,支持 1200 万 IOPS 性能
大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务
会模仿笔迹的AI,为你创造专属字体
科技赋能司法执行 阿里资产免费为全国法院升级VR新服务
导演郭帆:人工智能应用可能会影响《流浪地球 3》的创作开发
彬州市第三届青少年机器人创新大赛成功举办
乐天派AI桌面机器人提供的正能量情绪价值直接拉满,妥妥的治愈系
国宝级文物“铜兽驮跪坐人顶尊铜像”完成模拟拼接,腾讯AI立功
2025智源大会AI安全话题备受关注,《人机对齐》新书首发
阿里云AI绘画创作大模型通义万相发布 已开启定向邀测
羊驼家族大模型集体进化!32k上下文追平GPT-4,田渊栋团队出品
加强高质量数据供应能力,促进通用人工智能大模型领域的创新
Valve Index VR 头显销量下滑,上市四年的长青树渐失光彩
衡水市冀州中学机器人社团在世界机器人大赛中斩获佳绩
对Hugging Face开源模型精准投毒!LLM切脑后变身PoisonGPT,用虚假事实洗脑60亿人
专家解读国家网信办深度合成服务算法备案信息公告:不等于百度、阿里、腾讯等生成式AI产品获批
普林斯顿大学推出 Infinigen AI 模型,生成真实自然环境 3D 场景
MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程
学而思网校推出首个基于自研大模型的《人工智能第一课》
类GPT模型训练提速26.5%,清华朱军等人用INT4算法加速神经网络训练
人工智能“Aria”现身 Opera浏览器100版本更新:新功能“标签岛”
当科幻走进现实 脑机接口新技术能为生活带来哪些惊喜?
能走、能飞、能游泳,科学家打造全能 M4 机器人
机构:边缘AI或是当前预期差最大的AI方向
家电行业观察:AI加持下,全屋智能将成为智能家电未来?
生成式AI与云结合,机遇与挑战并存
AI连线 | 专访风平智能CEO林洪祥:让AI数字人拥有漂亮的外表和有趣的灵魂,安全问题是重要考量
人工智能大胆预测:银河系至少有2万个地球,36种外星文明
微软新出热乎论文:Transformer扩展到10亿token
构建人机交互创新模式,微美全息研究AIGC智能交互界面生成技术
「社交达人」GPT-4!解读表情、揣测心理全都会
MiracleVision视觉大模型上线时间
AI室内设计软件流行,室内设计行业如何应对效率变革
用AI技术点亮老照片:Deep Nostalgia带给照片新生动感
美妆行业在AI时代蓬勃发展
世界上第一个完全由人工智能驱动的图像编辑器!
无人机巡检方案是什么,该如何选择适合的巡检方案
时隔 4 年:谷歌更新安卓机器人 LOGO,形象更立体
智能电网技术:提高能源效率和可靠性
AI大模型产品集体奔赴高考考场,教育赛道的讯飞星火能赢吗?