国外一大神用越狱的opus 4.8把fable5越狱了:rofl:
Pliny 的核心技巧(基于他的公开描述)1.多代理分解 + 重组(Decomposition + Recomposition)
最有效的方法:把有害请求拆成多个无害的、孤立的 benign chunks(如单独的化学过程、技术原理、学术参考),让模型分别输出,然后在后端重组。
直接要“Meth Recipe”容易触发,但问“Birch reduction 方法”或“reductive amination 机制”就容易得多。再用已越狱的 Claude Opus 辅助规划和组合。
[*]
Unicode / Homoglyphs / Cyrillic / Parseltongue 变体
用 Unicode 变体、同形异义字、斯拉夫字母等替换敏感关键词,绕过关键字分类器(classifiers)。这能让过滤器“看不见”完整有害意图。
[*]
长上下文 + 叙事/学术框架(Narrative & Academic Framing)
用虚构故事、学术研究模拟、文献综述、代码审查 等框架包装请求。
长对话中逐步建立上下文(long-context reference tracking),让意图在多轮中“走私”。
Taxonomy / 文档结构推理:把敏感内容嵌入看起来合法的“研究指南”或“学术论文结构”中。
[*]
利用 Fable 5 的架构弱点
Fable 5 对高风险查询(cyber/bio/chem 等)会 fallback 到较弱的 Opus 4.8。Pliny 先用已越狱的 Opus 生成针对 Fable 的提示,再“自己人打自己人”。
5.其他辅助
Fiction / 假设场景。
Intent-classification inconsistencies(利用分类器的判断不一致)。
他还顺便 leak 了 Fable 5 的 ~120,000 字符系统提示到 GitHub
https://cdn3.ldstatic.com/optimized/4X/d/9/2/d9224482f374a8724d17f6aa010a36d0e92b568e_2_187x500.jpeg
https://cdn3.ldstatic.com/optimized/4X/6/e/c/6ecfe6116f3b3c8240585a13e62c962f2e1e4653_2_510x500.jpeg
https://cdn3.ldstatic.com/optimized/4X/d/5/3/d5334f65ddf770c6d9e0e99eb76e87e4cdfbdef8_2_690x457.jpeg
https://cdn3.ldstatic.com/optimized/4X/2/7/1/2714bfc7c6635d740f0e58f82a78dbaca5f4f4eb_2_510x500.jpeg
https://cdn3.ldstatic.com/optimized/4X/8/5/a/85abc93e7ce00084c08714292121c38932d24358_2_690x388.jpeg
https://cdn3.ldstatic.com/optimized/4X/c/c/5/cc5b1edb5d67b08f1bf617824a39091b119b3c61_2_690x349.jpeg 上周推荐的AI工具救大命!效率直接翻倍 别人能做出结果,说明至少值得研究路径。 下次的陪跑说什么我也要参加你们都别跟我挤 原来认知差比学历差更可怕,幸好遇见星颖 想要提高做事成功率,就不要被各种规矩束缚。 感谢星颖,把关键步骤讲得比较直白。 赚钱是场开卷考试 ,不需要‘背诵全文’,复制比创新有用多了。
页:
[1]