星颖资源网

 找回密码
 立即注册
查看: 6|回复: 0

Google 疑似在 Arena(竞技场) 秘密测试新版 Gemini 3.1 Flash:性能跃升,迫近Gemin

[复制链接]

2万

主题

1万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
110880
发表于 2026-5-2 20:37:49 | 显示全部楼层 |阅读模式
LMArena发现,一个标注为 Gemini 3 Flash 的模型出现频率异常增高。根据实际测试反馈,该模型的性能表现远超当前版本,甚至直逼 Gemini 3.1 Pro。
有测试者表示,在最近的 7 次抽卡中,该模型出现了 6 次。这种行为与此前 DeepSeek 测试 V4 时的策略如出一辙。:虽然目前在竞技场中仍沿用 “Gemini 3 Flash” 的名称,但其输出质量被评价为向上跳跃了两个层级。测试者普遍认为,其逻辑推理和代码生成能力已不再是单纯的Lite模型,其实际表现更接近目前的 Gemini 3.1 Pro


https://media.discordapp.net/attachments/966991673051725924/1500112537797136434/AiBattle_-_Google_may_be_testing_a_new_Gemini_3_Flash_model_on_the_Arena_right_n_TgaZNT.mp4?ex=69f7402b&is=69f5eeab&hm=e9e62e3ee79fcaf629451a06d612425e2439190111424e6c9915ec05294eec94&
除了竞技场上的惊艳表现,Google 向 Vertex AI 客户发送的最新邮件也侧面证实了产品线的更迭:
Google 计划于 2026 年 6 月 1 日 正式停用 Gemini 2.0 Flash 和 Flash Lite。官方建议用户尽快将工作负载迁移至即将推出的 Gemini 3.1 Flash Lite、Gemini 2.5 Flash Lite 或 Gemma 4。邮件中提到的“Gemini 3.1 Flash Lite 即将全面上线(GA)”,


Arena | Benchmark & Compare the Best AI Models (https://arena.ai/code)

Arena | Benchmark & Compare the Best AI Models (https://arena.ai/code)
Chat with multiple AI models side-by-side. Compare ChatGPT, Claude, Gemini, and other top LLMs. Crowdsourced benchmarks and leaderboards.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信

社群

VIP

AI

顶部

QQ|本站内容来源网友投稿或网络转载,如果有侵权的内容,请联系我们删除。|小黑屋|人人为我,我为人人!| 星颖资源网

GMT+8, 2026-6-8 09:59 , Processed in 0.044391 second(s), 22 queries .

快速回复 返回顶部 返回列表