星颖资源网

 找回密码
 立即注册
查看: 6|回复: 0

Warp开始支持BYOK功能

[复制链接]

2万

主题

1万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
110880
发表于 2026-5-23 13:49:37 | 显示全部楼层 |阅读模式
前情提要

知名AI终端Warp正式开放源代码 (https://linux.do/t/topic/2077546)前沿快讯 (https://linux.do/c/news/34)
[image] (https://cdn3.ldstatic.com/original/4X/9/a/9/9a92533d4b73ef36c68ebcac2fb5ab8feaaa4ab0.jpeg)
开源的威力开始显现,多项内容更新已经合并到官方仓库。(开源好啊,开源都是免费劳动力)

而现在,官方正式宣布在warp中支持用户自定义的api (https://x.com/warpdotdev/status/2057870604800332231)。

今天,我们发布了 Warp 社区最希望看到的更新之一:对推理过程的更多控制权。
开发者希望能够自行选择模型、使用自己的服务提供商账户、掌控推理成本,并且无需离开 Warp 平台即可尝试新的服务提供商。从今天开始,我们将进行两项改进,让 Warp 变得更加灵活:

  • BYOK 功能现在也适用于免费套餐用户。

  • Warp 现在支持与 OpenAI Chat Completions API 兼容的自定义推理端点。
    现在,你可以使用自己的 OpenAI、Anthropic 或 Google API 密钥来为 Warp 的代理功能提供支持。或者,你也可以将 Warp 与兼容 OpenAI 的终端节点相连,比如 OpenRouter、LiteLLM、z.ai,或是你自己的内部处理系统。
    (https://linux.do#p-18149272-h-1)
    为什么偏偏是现在?
    我们最近将 Warp 客户端开源了,因为我们希望 Warp 能变得更加开放、可定制,同时也能更好地符合开发人员的实际使用习惯。让用户自行开发推理引擎来驱动 Warp Agent,也是这一目标的一部分。
    在 Warp 中,使用 Warp Agent 依然是利用人工智能的最简单便捷的方式。该插件直接集成在 ADE 中,因此无需额外设置即可利用终端状态、代码库、规则、笔记本、工作流程、环境变量以及 MCP 服务器等资源。此外,Warp Agent 还能与 Warp 的代码审查、智能体管理功能以及 Oz 云平台完美配合使用。
    同时,模型层应具备更高的灵活性。开发者应能够根据自己的需求,选择最适合的推理方式来使用 Warp Agent。目前,Warp 尚未原生支持某些特定的模型配置、自定义的路由规则、提供者设置、内部网关功能,也无法处理与模型提供者相关的现有协议和约定。
    Warp 应能提供一套完整的智能体开发解决方案。开发者应能够自行选择相应的推理方式。
    今天有哪些可用资源/服务呢?
    BYOK 功能原本只在 Warp 的付费套餐中提供,现在我们也将其纳入了免费套餐中。免费用户可以为自己选择的合作伙伴添加 API 密钥,这些合作伙伴包括 OpenAI、Anthropic 和 Google。用户可以利用这些 API 密钥来提升 Warp 的智能体功能。在免费套餐中,使用 BYOK 功能需要登录账号,但个人用户可以免费使用该功能。
    Warp 现在还支持与 OpenAI Chat Completions API 兼容的自定义推理端点。你可以利用这一功能,将 Warp 与模型路由器、网关、托管服务提供商、内部端点或自托管的推理系统相连接。
    如果你有如下需求,自定义推理端点会非常有用:

  • Warp 目前还不支持直接使用该模型提供程序。

  • 通过模型路由器或网关来处理请求路径。

  • 尝试使用自己托管或自行搭建的推理系统来进行实验。
    我们希望开发者和各个团队能以各种方式来利用这一工具。我们很期待看到人们会用它来创造出什么新的东西。
    (https://linux.do#p-18149272-h-2)
    定价的运作方式
    对于个人开发者和小型团队来说,在 Warp 平台上使用自带的 API 密钥或自定义推理端点是完全免费的。无论您使用的是 Free、Build 还是 Max 套餐,只要您使用的是自带的 API 密钥或兼容的推理端点,且该服务是为个人或人数不超过 10 人的公司所使用,Warp 都不会收取任何费用。
    对许多开发者来说,Warp 提供的集成式推理功能仍然是最简单的选择。Warp 允许用户无需任何额外设置,即可使用 OpenAI、Anthropic 和 Google 等提供商的优质模型,以及各种顶级的开源模型。我们还负责与各模型提供商的沟通协调、确保模型的可用性、处理数据传输事宜,并保障数据隐私。由于 Warp 能从模型提供商那里获得批量采购折扣,因此使用 Warp 的积分来使用这些先进模型,是一种既方便又经济高效的方式,用户无需再分别管理各个提供商的账户、API 密钥、账单或端点配置。
    BYOK 和自定义端点适用于那些希望掌控推理过程的开发者。他们可以自由尝试 Warp 目前还不支持的各类服务提供商和模型。而“打包式推理”则适合那些希望让 Warp 来处理模型访问和基础设施相关工作的开发者。
    对于员工人数超过 10 人的公司而言,使用自带设备或自定义终端的方式,必须通过 Warp 的“Business”或“Enterprise”套餐来实现。规模较大的团队则将 Warp 的托管服务作为整个平台解决方案的一部分来使用:该平台还提供工具协调、上下文管理、团队使用情况监控、管理控制、治理机制、安全策略等功能,同时还能满足在整个组织内部署 AI 智能体的基础设施需求。
    对于企业和商业客户而言,如果自行处理推理任务,将会消耗平台积分。这些积分是根据智能体在 Warp 的托管系统中实际运行所花费的时间来计算的,而非与模型推理本身相关的成本。由于客户自行提供模型、API 密钥或端点,因此使用这种方式时,所消耗的 Warp 积分远远低于 Warp 直接提供模型推理服务时的消耗量。
    (https://linux.do#p-18149272-h-3)
    接下来要做什么呢?
    从长远来看,开发人员和团队不会再只使用某一种模型、某个供应商或某一种工具。他们会根据具体的任务需求、成本、延迟、安全要求以及执行环境来选择合适的方案。Warp 应该能成为应对这种需求的最佳接口。
    接下来,我们计划将一个轻量级的 Rust 客户端工具添加到我们的开源代码库中。这样一来,Warp 就能直接与本地模型进行连接,而无需经过 Warp 的服务器中转。我们还计划支持 Agent Client Protocol,这样开发者就可以将其他客户端工具集成到 Warp 的终端用户界面中。所有这些功能都将在客户端端实现,用户无需登录即可使用。
    这与我们在将 Warp 客户端开源时所阐述的方针是一致的:我们希望 Warp 能更加开放、更具可定制性,其设计应符合开发人员的实际工作方式。同时,我们也要确保产品的完整性和可持续性。
    首先,打开 Warp 软件,进入“设置”→“AI”选项,然后输入您的 API 密钥或配置自定义的推理端点。
    请亲自试用一下,然后告诉我们:您希望 Warp 接下来能够支持哪些服务提供商、端点、本地模型设置以及智能体框架。我们非常期待您的反馈。
  • 回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    微信

    社群

    VIP

    AI

    顶部

    QQ|本站内容来源网友投稿或网络转载,如果有侵权的内容,请联系我们删除。|小黑屋|人人为我,我为人人!| 星颖资源网

    GMT+8, 2026-6-8 05:42 , Processed in 0.044498 second(s), 22 queries .

    快速回复 返回顶部 返回列表