发布时间:2025-07-22
点击次数: 作者:puneet kumar,rivos 公司联合创始人兼首席执行官
人工智能正在重塑软硬件设计的基本逻辑。过去需耗时 18 至 24 个月的传统服务器硬件开发流程,如今已被压缩至仅 12 个月;与此同时,软件层面通过改进 Attention 机制等技术,在两年内实现了性能提升十倍的飞跃——这迫使硬件架构必须向“软件定义硬件(SDH)”转型。客户的需求也从单一追求高性能,演变为对多框架兼容和多种模型支持的灵活性要求:不仅要高效运行当前主流模型,还需快速适配未来可能出现的新模型与新框架。为此,行业应借鉴 GPGPU 架构理念,融合开源生态与开放标准,借助协作式创新打破厂商壁垒,增强硬件可编程能力并实现可持续扩展,从而降低能耗、延长设备寿命,并提升整体投资回报率。
图一、AI 对软硬件设计范式的颠覆性冲击
硬件迭代显著提速:传统服务器硬件研发周期长达 18–24 个月,而在 AI 驱动下现已缩短至一年内,开发、验证与迭代节奏全面加快。
软件性能指数级跃升:以 Attention 技术为例,Flash Attention 系列在 2025 到 2025 年间完成三次重大优化,每次带来 2–3 倍性能增益,累计实现两年十倍的突破。
典型实例佐证趋势:vLLM 的
Paged Attention 技术使吞吐量提升 3–5 倍;Mamba 模型正逐步取代 Transformer 成为新兴架构选择。
二、客户需求重心转移:由静态性能转向动态适应力
| 需求维度 | 传统硬件满足度 | AI 时代新诉求 | 实现路径 |
|---|---|---|---|
| 现有模型效率 | ✅ | 需持续精进 | 针对核心算法进行硬件专项加速 |
| 未来模型支持 | ❌ | 敏捷响应新模型(如 Mamba) | 采用可编程架构 + 开源生态支撑 |
| 多框架兼容性 | ❌ | 无缝运行 PyTorch/TensorFlow/JAX 等多种框架 | 依托开放标准 + 统一编程接口 |
AI 服务器用户的关注点发生了哪些根本变化?
答案是从单一性能指标转向多维灵活性:既要保障现有模型(如 Transformer)的高效率执行,也要具备快速接纳未来模型(如 Mamba)的能力,同时还需兼容主流深度学习框架(PyTorch/TensorFlow 等)。传统专用加速器只能满足第一项,唯有结合可编程硬件与开源生态,方能兼顾后两项关键需求。
三、软件定义硬件(SDH)与 GPGPU 架构的融合之道
SDH 的核心设计理念
保持原有编程模型不变,最大限度减少软件迁移成本(例如兼容现有代码库);
在硬件层面聚焦核心任务优化(如矩阵乘法),剥离冗余模块以节省功耗和芯片面积。
GPGPU 的天然契合性
其高并行、多线程特性完美匹配 AI 工作负载特征,目前约 90% 的前沿 AI 模型均基于 GPGPU 进行训练与部署。
Zyro AI Background Remover
Zyro推出的AI图片背景移除工具
145
查看详情
四、开源生态的战略杠杆价值
开源带来的三大核心优势
成本控制:借助社区协作共享成果,避免重复造轮子,显著缩短产品上市时间(如 vLLM 就是依托开源社区快速演进的典范);
灵活定制:代码透明化允许深度个性化调整,规避对单一供应商的依赖,开放标准让多厂商技术混搭成为可能;
协同进化:跨机构合作加速技术迭代(vLLM、Flash Attention 等突破皆源于开源社区合力)。
开放标准的关键作用:实现软硬件组件解耦,允许独立升级(如软件更新无需更换硬件),构建可持续演进的技术体系。
五、面向未来的硬件战略方向
设计目标明确:打造支持开源生态的可编程 GPGPU 架构,在当前性能与未来适应性之间取得最优平衡。
优选参与开源项目的供应商,可带来三重收益:
投资回报最大化:硬件生命周期随软件演进而延长;
部署敏捷性增强:基于开放标准自由切换技术方案;
绿色低碳转型:通过架构精简降低功耗(如剔除无用功能单元)。
以上就是AI如何变革软件和硬件开发的范式?的详细内容,更多请关注其它相关文章!
# 还需
# 苍南这边网站建设
# 商城网站建设招标公告
# 常州网站建设银行
# 福建省茶叶企业网站建设
# 惠州英文网站建设
# 南京网站营销推广有哪些
# 新品牌推广营销策略分析
# 江西seo推广加盟
# 石岩自动网站推广
# seo全网推广营销软件排名榜
# ai
# 多款
# 已成
# 迭代
# 长江
# 多线程
# 个月
# 未来
# 可编程
# 开源
# 硬件开发
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
赋能选题探索:AI助手在经济学专业中的应用指南
李开复:未来几年,人工智能会革了所有人的命,除非你这么做
美图公司影像节或发布AI设计新品
马斯克“揭秘”人工智能真面目
视觉中国推出AI灵感绘图功能
70年前他本想逃避考试,却影响了整个互联网
特斯拉机器人面世 未来将大幅提振磁材需求,引领人工智能时代
搭载星火认知大模型 讯飞听见智慧屏开启AI办公新体验
“具身智能”引爆机器人产业,看绝影Lite3/X20四足机器人有何特别之处?
马斯克:将来机器人比人类多!特斯拉机器人亮相人工智能大会
百度创始人、董事长兼首席执行官李彦宏:AI原生应用比大模型数量更重要
眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷
华为HarmonyOS 4将集|成人|工智能大型模型
调查:过半数艺术家认为 AI 作图无法帮助他们的工作
类GPT模型训练提速26.5%,清华朱军等人用INT4算法加速神经网络训练
深圳人工智能企业超1900家
OpenAI首席执行官表态支持欧盟AI监管
Nature封面:量子计算机离实际应用还有两年
英特尔张宇:边缘计算在整个AI生态系统中扮演重要角色
AI技术加速迭代:周鸿祎视角下的大模型战略
AI生成新闻网站数量激增,正在疯狂赚取广告收入
6月14日《星空下的对话》 张朝阳陆川将畅聊人生、电影、心理学与AI
2025年贵州省青少年机器人竞赛在安举行
“三夏”农忙保障用电,无人机高空巡视高压线
杀入生成式AI的亚马逊云科技,能否再次生成未来?
OPPO三方联合发布AI可持续发展白皮书,坚持发展健康AI生态
论文插图也能自动生成了,用到了扩散模型,还被ICLR接收
一公司推出喷火机器狗,可喷出 9 米长火焰
马斯克称人类是半机器人,记忆外包给了电脑
图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响
自己动手使用AI技术实现数字内容生产
Xbox游戏工作室负责人:VR/AR领域的用户规模还不足够
数据显示:人工智能相关专业热度上升最快 考古、美术、生物医学工程等小众专业火了
普渡机器人与变形金刚品牌合作,特别活动爆火,商品售罄!
国内阅读行业首款对话式AI应用“阅爱聊”封闭内测
谷歌计划在上海举办开发者大会,重点关注机器学习和生成式AI领域
Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
RoboNeo安装教程
智能机器人正在彻底改变客户服务
Moka发布AI原生HR SaaS产品“Moka Eva”,布局AGI时代
英伟达推出 L40S GPU,AI 推理性能超过 A100 约 1.2 倍
2025 WAIC|美团无人机发布第四代新机型
构建人机交互创新模式,微美全息研究AIGC智能交互界面生成技术
羊驼家族大模型集体进化!32k上下文追平GPT-4,田渊栋团队出品
利用AI探索抗体“钥匙”、加速药物研发——访百图生科团队
金山办公宣布与英伟达团队合作,加速WPS AI服务
2025年深圳举办的SUSECON 创新峰会开始接受报名
长宁这家企业在世界人工智能大会上荣获“蓝鼎奖”
优地网络助力新媒体拥抱人工智能时代
腾讯自主研发机器狗 Max 升级,可“奔跑跳跃”完成避障动作