国外一大神用越狱的opus 4.8把fable5越狱了:rofl:

星颖发表于 2026-6-11 15:16:16

Pliny 的核心技巧（基于他的公开描述）
1.多代理分解 + 重组（Decomposition + Recomposition）
最有效的方法：把有害请求拆成多个无害的、孤立的 benign chunks（如单独的化学过程、技术原理、学术参考），让模型分别输出，然后在后端重组。
直接要“Meth Recipe”容易触发，但问“Birch reduction 方法”或“reductive amination 机制”就容易得多。再用已越狱的 Claude Opus 辅助规划和组合。
[*]
Unicode / Homoglyphs / Cyrillic / Parseltongue 变体
用 Unicode 变体、同形异义字、斯拉夫字母等替换敏感关键词，绕过关键字分类器（classifiers）。这能让过滤器“看不见”完整有害意图。
[*]
长上下文 + 叙事/学术框架（Narrative & Academic Framing）
用虚构故事、学术研究模拟、文献综述、代码审查等框架包装请求。
长对话中逐步建立上下文（long-context reference tracking），让意图在多轮中“走私”。
Taxonomy / 文档结构推理：把敏感内容嵌入看起来合法的“研究指南”或“学术论文结构”中。
[*]
利用 Fable 5 的架构弱点
Fable 5 对高风险查询（cyber/bio/chem 等）会 fallback 到较弱的 Opus 4.8。Pliny 先用已越狱的 Opus 生成针对 Fable 的提示，再“自己人打自己人”。
5.其他辅助
Fiction / 假设场景。
Intent-classification inconsistencies（利用分类器的判断不一致）。
他还顺便 leak 了 Fable 5 的 ~120,000 字符系统提示到 GitHub
https://cdn3.ldstatic.com/optimized/4X/d/9/2/d9224482f374a8724d17f6aa010a36d0e92b568e_2_187x500.jpeg
https://cdn3.ldstatic.com/optimized/4X/6/e/c/6ecfe6116f3b3c8240585a13e62c962f2e1e4653_2_510x500.jpeg
https://cdn3.ldstatic.com/optimized/4X/d/5/3/d5334f65ddf770c6d9e0e99eb76e87e4cdfbdef8_2_690x457.jpeg
https://cdn3.ldstatic.com/optimized/4X/2/7/1/2714bfc7c6635d740f0e58f82a78dbaca5f4f4eb_2_510x500.jpeg
https://cdn3.ldstatic.com/optimized/4X/8/5/a/85abc93e7ce00084c08714292121c38932d24358_2_690x388.jpeg
https://cdn3.ldstatic.com/optimized/4X/c/c/5/cc5b1edb5d67b08f1bf617824a39091b119b3c61_2_690x349.jpeg

PanYunTing3 发表于 2026-6-12 04:13:15

上周推荐的AI工具救大命！效率直接翻倍

ChenYueHan9 发表于 2026-6-16 09:48:12

别人能做出结果，说明至少值得研究路径。

DaiTianYu7 发表于 2026-6-20 09:56:17

下次的陪跑说什么我也要参加你们都别跟我挤

编程猿代码 发表于 2026-6-24 04:23:53

原来认知差比学历差更可怕，幸好遇见星颖

FengBoWen1 发表于 2026-6-28 12:14:14

想要提高做事成功率，就不要被各种规矩束缚。

GuoErGuan5 发表于 3 天前

感谢星颖，把关键步骤讲得比较直白。

JinMuLan3 发表于前天 07:40

赚钱是场开卷考试，不需要‘背诵全文’，复制比创新有用多了。

页: [1]

星颖资源网's Archiver

国外一大神用越狱的opus 4.8把fable5越狱了:rofl: