星颖 发表于 2026-6-11 15:16:16

国外一大神用越狱的opus 4.8把fable5越狱了:rofl:

Pliny 的核心技巧(基于他的公开描述)
1.多代理分解 + 重组(Decomposition + Recomposition)
最有效的方法:把有害请求拆成多个无害的、孤立的 benign chunks(如单独的化学过程、技术原理、学术参考),让模型分别输出,然后在后端重组。
直接要“Meth Recipe”容易触发,但问“Birch reduction 方法”或“reductive amination 机制”就容易得多。再用已越狱的 Claude Opus 辅助规划和组合。
[*]
Unicode / Homoglyphs / Cyrillic / Parseltongue 变体
用 Unicode 变体、同形异义字、斯拉夫字母等替换敏感关键词,绕过关键字分类器(classifiers)。这能让过滤器“看不见”完整有害意图。
[*]
长上下文 + 叙事/学术框架(Narrative & Academic Framing)
用虚构故事、学术研究模拟、文献综述、代码审查 等框架包装请求。
长对话中逐步建立上下文(long-context reference tracking),让意图在多轮中“走私”。
Taxonomy / 文档结构推理:把敏感内容嵌入看起来合法的“研究指南”或“学术论文结构”中。
[*]
利用 Fable 5 的架构弱点
Fable 5 对高风险查询(cyber/bio/chem 等)会 fallback 到较弱的 Opus 4.8。Pliny 先用已越狱的 Opus 生成针对 Fable 的提示,再“自己人打自己人”。
5.其他辅助
Fiction / 假设场景。
Intent-classification inconsistencies(利用分类器的判断不一致)。
他还顺便 leak 了 Fable 5 的 ~120,000 字符系统提示到 GitHub
https://cdn3.ldstatic.com/optimized/4X/d/9/2/d9224482f374a8724d17f6aa010a36d0e92b568e_2_187x500.jpeg
https://cdn3.ldstatic.com/optimized/4X/6/e/c/6ecfe6116f3b3c8240585a13e62c962f2e1e4653_2_510x500.jpeg
https://cdn3.ldstatic.com/optimized/4X/d/5/3/d5334f65ddf770c6d9e0e99eb76e87e4cdfbdef8_2_690x457.jpeg
https://cdn3.ldstatic.com/optimized/4X/2/7/1/2714bfc7c6635d740f0e58f82a78dbaca5f4f4eb_2_510x500.jpeg
https://cdn3.ldstatic.com/optimized/4X/8/5/a/85abc93e7ce00084c08714292121c38932d24358_2_690x388.jpeg
https://cdn3.ldstatic.com/optimized/4X/c/c/5/cc5b1edb5d67b08f1bf617824a39091b119b3c61_2_690x349.jpeg

PanYunTing3 发表于 2026-6-12 04:13:15

上周推荐的AI工具救大命!效率直接翻倍

ChenYueHan9 发表于 2026-6-16 09:48:12

别人能做出结果,说明至少值得研究路径。

DaiTianYu7 发表于 2026-6-20 09:56:17

下次的陪跑说什么我也要参加你们都别跟我挤

编程猿代码 发表于 2026-6-24 04:23:53

原来认知差比学历差更可怕,幸好遇见星颖

FengBoWen1 发表于 2026-6-28 12:14:14

想要提高做事成功率,就不要被各种规矩束缚。

GuoErGuan5 发表于 3 天前

感谢星颖,把关键步骤讲得比较直白。

JinMuLan3 发表于 前天 07:40

赚钱是场开卷考试 ,不需要‘背诵全文’,复制比创新有用多了。
页: [1]
查看完整版本: 国外一大神用越狱的opus 4.8把fable5越狱了:rofl: