九个月，一颗“辣椒”：

星颖发表于 6 天前

【AI】

九个月，一颗“辣椒”：OpenAI 用 AI 造芯背后的全栈野心

九个月，一颗名为 Jalapeño（墨西哥辣椒）的芯片完成首次流片（Tape-out）。

这不是科幻小说的情节，而是 OpenAI 刚刚公布的现实。当地时间 6 月 24 日，OpenAI 联合博通（Broadcom）宣布，其首款自研 AI 推理芯片 Jalapeño 成功完成首次流片。这颗芯片既不是传统意义上的 GPU，也不是 TPU，而是 OpenAI 将其称为 Intelligence Processor（智能处理器）——一款专为大模型推理优化设计的 ASIC。

OpenAI 将这一项目称为 “史上最快的高性能先进半导体 ASIC 开发周期之一”，并表示 AI 深度参与了芯片设计流程，大幅缩短了研发周期。一个有趣的闭环正在形成：AI 不仅成为芯片运行的对象，也开始成为芯片研发的重要工具。

这不仅仅是一场技术展示，更是一场战略升级。

OpenAI 与博通、Celestica 构成了一条高度协同的产业链：OpenAI 主导芯片架构设计与系统需求定义；博通负责 ASIC 工程实现、网络互联及量产支持；Celestica 则承担服务器系统集成与交付。三方各司其职，共同完成了一套完整的 AI 基础设施方案。

过去，OpenAI 的商业模式相对“轻资产”。

它最核心的竞争力，是训练世界领先的大模型，并通过 API 与 ChatGPT 等产品将能力商业化。对于外界而言，OpenAI 的优势主要体现在模型、算法和软件能力。

而 Jalapeño 的出现，则意味着 OpenAI 正开始向 AI 基础设施更深处延伸。

芯片架构、推理系统、运行时（Runtime）、编译器优化、任务调度，以及底层部署能力，都开始成为 OpenAI 希望持续掌握的重要环节。

用他们自己的话来说，这就是 Full-Stack（全栈）。

而全栈的意义，远不止于降低成本。

诚然，自研推理芯片最直接的目标，是降低对通用 GPU 的依赖，并持续优化推理成本。当每天都要处理数十亿次模型调用时，哪怕单位推理成本下降几个百分点，长期累积都会形成巨大的商业优势。

但更重要的是，它正在形成一个持续强化的技术飞轮。

当芯片架构能够围绕自家模型持续优化，模型推理效率就会进一步提升；更高的效率意味着更低的推理成本、更快的响应速度以及更大的服务规模；这些真实运行数据又会反过来帮助模型、编译器和芯片持续迭代。

模型、软件栈与硬件开始形成越来越紧密的协同优化。

一旦这个飞轮持续运转，竞争优势就不再只是模型能力，而会逐渐演变成算法、系统软件与基础设施共同构成的综合壁垒。

当然，这条通往“全栈”的道路并不会轻松。

半导体依然是资本、人才和技术密度最高的产业之一。即便拥有博通这样的合作伙伴，在晶圆制造、先进封装、HBM 高带宽内存等关键环节，OpenAI 仍然需要依赖包括台积电在内的全球供应链。制造能力、供应链稳定性以及地缘政治因素，依旧是所有 AI 公司必须面对的现实约束。

这也是为什么越来越多科技巨头都在推动自己的 AI 基础设施战略。

谷歌持续迭代 TPU，亚马逊推出 Trainium，微软发布 Azure Maia，Meta 也在持续推进自研 AI 芯片计划。

虽然各家的路线并不完全相同，但方向却越来越一致：希望掌握更多 AI 基础设施中的关键能力，从而在性能、成本和迭代速度之间建立长期优势。

如果你最近正在比较不同模型或准备接入 AI API，也会发现，随着基础设施不断演进，各家模型的能力、价格和推理效率都在快速变化。我把这些主流模型整理到了 GPTProto API Hub，方便统一查看和测试。
https://gptproto.com/?s=scys

Jalapeño 这颗“辣椒”的真正意义，并不在于它今天跑出了多少 TOPS，也不在于它与英伟达 GPU 谁更强。

真正值得关注的是，它释放出了一个越来越清晰的信号：

AI 的竞争，正在从模型竞争，逐步走向基础设施竞争。

未来真正决定竞争力的，可能不只是模型排行榜上的分数，而是谁能够率先完成模型（Model）→ 编译器（Compiler）→ 运行时（Runtime）→ 硬件（Hardware）的全栈闭环，让每一次模型迭代都能同步驱动整个系统持续优化。

这颗“辣椒”，或许只是 AI 全栈时代的第一道开胃菜。

YangMingLi4 发表于 5 天前

混星颖第二年，认知差让我甩开同龄人三条街

刘大哥 发表于昨天 03:38

当你作出决定后，便要一心一意地朝着目标走，常常记着名誉是你的最大资产，今天便要建立起来

页: [1]

星颖资源网's Archiver

九个月，一颗“辣椒”：