星颖 发表于 6 天前

九个月,一颗“辣椒”:

【AI】

九个月,一颗“辣椒”:OpenAI 用 AI 造芯背后的全栈野心

九个月,一颗名为 Jalapeño(墨西哥辣椒) 的芯片完成首次流片(Tape-out)。

这不是科幻小说的情节,而是 OpenAI 刚刚公布的现实。当地时间 6 月 24 日,OpenAI 联合博通(Broadcom)宣布,其首款自研 AI 推理芯片 Jalapeño 成功完成首次流片。这颗芯片既不是传统意义上的 GPU,也不是 TPU,而是 OpenAI 将其称为 Intelligence Processor(智能处理器)——一款专为大模型推理优化设计的 ASIC。

OpenAI 将这一项目称为 “史上最快的高性能先进半导体 ASIC 开发周期之一”,并表示 AI 深度参与了芯片设计流程,大幅缩短了研发周期。一个有趣的闭环正在形成:AI 不仅成为芯片运行的对象,也开始成为芯片研发的重要工具。

这不仅仅是一场技术展示,更是一场战略升级。

OpenAI 与博通、Celestica 构成了一条高度协同的产业链:OpenAI 主导芯片架构设计与系统需求定义;博通负责 ASIC 工程实现、网络互联及量产支持;Celestica 则承担服务器系统集成与交付。三方各司其职,共同完成了一套完整的 AI 基础设施方案。

过去,OpenAI 的商业模式相对“轻资产”。

它最核心的竞争力,是训练世界领先的大模型,并通过 API 与 ChatGPT 等产品将能力商业化。对于外界而言,OpenAI 的优势主要体现在模型、算法和软件能力。

而 Jalapeño 的出现,则意味着 OpenAI 正开始向 AI 基础设施更深处延伸。

芯片架构、推理系统、运行时(Runtime)、编译器优化、任务调度,以及底层部署能力,都开始成为 OpenAI 希望持续掌握的重要环节。

用他们自己的话来说,这就是 Full-Stack(全栈)。

而全栈的意义,远不止于降低成本。

诚然,自研推理芯片最直接的目标,是降低对通用 GPU 的依赖,并持续优化推理成本。当每天都要处理数十亿次模型调用时,哪怕单位推理成本下降几个百分点,长期累积都会形成巨大的商业优势。

但更重要的是,它正在形成一个持续强化的技术飞轮。

当芯片架构能够围绕自家模型持续优化,模型推理效率就会进一步提升;更高的效率意味着更低的推理成本、更快的响应速度以及更大的服务规模;这些真实运行数据又会反过来帮助模型、编译器和芯片持续迭代。

模型、软件栈与硬件开始形成越来越紧密的协同优化。

一旦这个飞轮持续运转,竞争优势就不再只是模型能力,而会逐渐演变成算法、系统软件与基础设施共同构成的综合壁垒。

当然,这条通往“全栈”的道路并不会轻松。

半导体依然是资本、人才和技术密度最高的产业之一。即便拥有博通这样的合作伙伴,在晶圆制造、先进封装、HBM 高带宽内存等关键环节,OpenAI 仍然需要依赖包括台积电在内的全球供应链。制造能力、供应链稳定性以及地缘政治因素,依旧是所有 AI 公司必须面对的现实约束。

这也是为什么越来越多科技巨头都在推动自己的 AI 基础设施战略。

谷歌持续迭代 TPU,亚马逊推出 Trainium,微软发布 Azure Maia,Meta 也在持续推进自研 AI 芯片计划。

虽然各家的路线并不完全相同,但方向却越来越一致:希望掌握更多 AI 基础设施中的关键能力,从而在性能、成本和迭代速度之间建立长期优势。

如果你最近正在比较不同模型或准备接入 AI API,也会发现,随着基础设施不断演进,各家模型的能力、价格和推理效率都在快速变化。我把这些主流模型整理到了 GPTProto API Hub,方便统一查看和测试。
https://gptproto.com/?s=scys

Jalapeño 这颗“辣椒”的真正意义,并不在于它今天跑出了多少 TOPS,也不在于它与英伟达 GPU 谁更强。

真正值得关注的是,它释放出了一个越来越清晰的信号:

AI 的竞争,正在从模型竞争,逐步走向基础设施竞争。

未来真正决定竞争力的,可能不只是模型排行榜上的分数,而是谁能够率先完成 模型(Model)→ 编译器(Compiler)→ 运行时(Runtime)→ 硬件(Hardware) 的全栈闭环,让每一次模型迭代都能同步驱动整个系统持续优化。

这颗“辣椒”,或许只是 AI 全栈时代的第一道开胃菜。

YangMingLi4 发表于 5 天前

混星颖第二年,认知差 让我甩开同龄人三条街

刘大哥 发表于 昨天 03:38

当你作出决定后,便要一心一意地朝着目标走,常常记着名誉是你的最大资产,今天便要建立起来
页: [1]
查看完整版本: 九个月,一颗“辣椒”: