400 128 6709

行业新闻

字节跳动BitsAI-CR:基于LLM的代码审查系统技术揭秘

发布时间:2025-02-04点击次数:

字节跳动ai代码审查系统bitsai-cr:提升研发效率的实践探索

在人工智能浪潮下,大语言模型(LLM)正深刻改变软件开发模式。字节跳动近日公开其内部广泛使用的代码审查系统BitsAI-CR的技术细节,展现了AI在提升企业研发效率方面的显著进展。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片论文地址:https://www.php.cn/link/08ed87bd895f5562aacffd47d4c086eb

代码审查是保障软件质量的关键,但在大型企业中却面临诸多挑战。字节跳动内部数据显示,超过六成工程师渴望更高效的代码审查工具。虽然LLM在代码理解方面潜力巨大,但工业级应用仍面临三大难题:审查准确率低、低价值评论过多以及缺乏系统性改进机制。针对这些挑战,BitsAI-CR应运而生,并在服务超过1.2万周活跃开发者的实际应用中,实现了75%的审查准确率和26.7%的评论过时率。

图片

两阶段评论生成架构:确保高质量审查

传统LLM代码审查方案常受困于低准确率和幻觉问题。字节跳动研究团队通过实验发现,单纯依靠模型微调效果有限。因此,他们创新性地采用了“识别+验证”的两阶段生成架构:

  1. RuleChecker: 利用Tree-sitter技术精确识别代码块和函数边界,构建上下文,并基于字节内部219条多维度审查规则,使用LoRA微调的Doubao-Pro-32K-0828模型生成审查评论。这些规则涵盖代码缺陷、安全漏洞、可维护性和性能等四个方面,并集成动态规则黑名单,确保审查标准与企业实践动态一致。

图片

  1. ReviewFilter: 为了过滤模型幻觉和低价值评论,另一个微调的Doubao-Pro-32K-0828模型对RuleChecker的输出进行二次验证,对每条评论进行“是/否”判断并给出理由。实验表明,“结论在前”的推理模式性能最佳,准确率达77.09%,且推理时间较短。

图片

最终的审查结果通过评论聚合机制处理,利用基于Doubao-embedding-large的向量化方法计算评论相似度,避免重复信息干扰开发者。实验显示,该架构在Go语言离线评测集上实现了65.59%的评论准确率。

Health AI健康云开放平台 Health AI健康云开放平台

专注于健康医疗垂直领域的AI技术开放平台

Health AI健康云开放平台 113 查看详情 Health AI健康云开放平台

图片

评论过时率(Outdated Rate):更全面的评价指标

研究团队引入“评论过时率”指标,通过追踪被标记代码行在后续提交中的修改比例,更客观地衡量审查建议的实际价值。

图片图片

数据飞轮:持续优化系统

BitsAI-CR采用数据飞轮机制持续优化审查规则。通过用户反馈、人工标注和每周的Outdated Rate监控,系统能够识别并改进高准确率但低实用性的规则,确保系统持续保持高实用性。在18周的部署中,评论准确率从25%提升至75%,Go语言场景下的Outdated Rate达到26.7%,接近人工审查水平。目前,系统已服务超过1.2万名周活跃开发者,用户满意度达74.5%。

图片

BitsAI-CR的成功实践证明了LLM在提升企业软件开发效率方面的巨大潜力,为AI编程助手的规模化应用提供了重要参考。

以上就是字节跳动BitsAI-CR:基于LLM的代码审查系统技术揭秘的详细内容,更多请关注其它相关文章!


# 入门  # 提升企业  # 网站运营与推广的区别  # 东营网站建设与制作  # 徐汇抖音seo搜索  # 信息化关键词排名大全  # 深圳单位网站建设  # 信誉好的线上营销推广  # 太仓网站建设案件数据  # seo网站去联火星6  # 知彼网络网站建设  # 无锡网站怎么推广的  # 混搭  # 多维  # 中英  # 内测  # 生命科学  # 多家  # 日韩  # 多语言  # 一言  # ai  # go语言  # 字节跳动 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 7条线路感受智慧美好生活,“2025 世界人工智能大会民营企业社会开放日”主题活动启动  人工智能驱动艺术,打开达利的超现实想象  两型无人机完成交付!国家级机动观测业务正式启动  全新小艺搭载AI大模型,有效提升学生和职场人士的工作效率  ​日媒:AI高效解析纳斯卡地画  13万个注释神经元,5300万个突触,普林斯顿大学等发布首个完整「成年果蝇」大脑连接组  清华朱军团队新作:使用4位整数训练Transformer,比FP16快2.2倍,提速35.1%,加速AGI到来!  吉林首例!机器人辅助下搭桥手术成功实施  放弃自动驾驶,也是一种和解  CharacterAI - 也许会成为会话人工智能的未来  Meta Connect 2025已确定时间为9月27-28,主题涵盖Quest 3与AI技术  无人机在电力巡检中的应用:全面解析高效巡检流程  OpenAI CEO 山姆・阿尔特曼呼吁 AI 领域中美应当合作  这效果能打几分?AI真人化《名侦探柯南》  自动驾驶汽车避障、路径规划和控制技术详解  讯飞星火大模型实现升级 助力通用人工智能人才培养  微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课  优地网络助力新媒体拥抱人工智能时代  从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级  马斯克发推讽刺人工智能:机器学习的本质就是统计  微软宣布为 Azure AI 添加男性声线,增强文本转语音功能  复盘MWC上海:AI大模型时代到来 通信网络将会怎样改变?  在这里见未来!杭州未来科技城全球AI盛会邀您共探最前沿  谷歌推出新 AI 工具 Imagen Editor,一句话对图片二次创作  笔神作文声讨学而思AI大模型 称用“爬虫”技术盗取数据  腾讯AI首次模拟拼接三星堆文物,工作取得阶段性的成果  物联网和人工智能的协同作用:释放预测性维护的潜力  Bing 聊天机器人现支持在桌面端用语音提问  多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展  掌阅科技入选北京市通用人工智能产业创新伙伴计划第二批成员名单  联想创投携手12家被投企业MWC展示元宇宙、机器人等技术  工业机器人及非标自动化设备集成服务提供商  参考封面|人工智能“淘金热”  《共同的演化》展览启幕,重新思考人类与人工智能关系  云深处科技绝影 Lite3 与 X20 四足机器人亮相  7/8上海 | 2025世界人工智能大会分论坛:科技与人文-共筑无障碍智能社会  NTU、上海AI Lab整理300+论文:基于Transformer的视觉分割最新综述出炉  2025世界人工智能大会成功召开  微软Xbox称VR和AR还需要时间 先玩大的  智能化解决方案:保障数据安全阻击泄露和丢失  美的推出 AI 双视精准避障的自动集尘扫拖机器人 V12,售价仅为2999元  联想举办2025创新开放日,展出260余项算力及AI产品技术  昌吉市利用无人机实现全天候河道动态巡检  CREATOR制造、使用工具,实现LLM「自我进化」  十个AI算法常用库J*a版  AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑  Databricks推出人工智能模型共享机制,可令开发者与公司“双赢”  管提需求,大模型解决问题:图表处理神器SheetCopilot上线  华为昇腾AI原生支持30多种基础大模型,包括GPT  特斯拉门店可能启动机器人卖车?也许不是你想的那样 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司