
机器之机杼剪部
上周,Claude Code 发布了一个新能力:动态责任流。
该功能允许 Claude 根据具体任务即时编写定制化引申框架,配合多个子 Agent 并行责任,处置大畛域、高并行、反抗性任务中的系统性失效问题。
近日,Anthropic 工程师 Thariq 发了篇长文,分享了他起先的责任流警戒和心得。
咱们对此进行了全文整理译述。
在深切时期细节之前,Thariq 先提供了一些示例提醒,来让咱们交融责任流的后劲:
「这个测试可能每 50 次启动失败一次。诞生一个责任流,重叠启动测试,造成假定,并在责任树中对其进行反抗性考证 / 标的:束缚尝试,直到有一个假定生效。」
「使用责任流,归来我最近的 50 次会话,挖掘我反复犯的弱点,并将这些重叠性问题生成 CLAUDE.md 章程。」
「用责任流翻查畴前六个月 Slack 的 #incidents 频谈,找出反复出现、但还莫得东谈主提交工单的根底原因。」
「拿我的交易贪图,启动一个责任流,让不同的 Agent 从投资者、客户和竞争敌手的角度进行拆解。」
「这里有一个包含 80 份简历的文献夹,用责任流对其进行名次,选出后端岗亭的最好候选,并对前十名进行复核。使用 AskUserQuestion 器具进行口试评分。」
「我需要给这个 CLI 器具取名。使用责任流生成多个选项,并进行淘汰赛选出前三个最好决议。」
「使用责任流,将咱们的 User 模子重定名为 Account。」
「审查我的博客著述草稿,使用责任流考证每一项时期声明是否合适代码库,确保不发布弱点信息。」
动态责任流如何责任
动态责任流引申一个包含特殊函数的 JavaScript 文献,这些函数匡助生成和配合子 Agent。

同期,动态责任流还包括法子 JavaScript 功能,如 JSON、Math 和 Array,用于处理数据。
动态责任流不错决定一个 Agent 使用的模子类型,以及子 Agent 是否在沉寂的责任树中启动,从而让 Claude 选拔所需的智能水和善防止款式。
淌若责任流中断,例如被用户操作或终局退出,还原会话时,责任流不错从中断点连续引申。
为何使用动态责任流
当咱们使用默许 Claude Code 框架引申任务时,它需要在并吞个高下文窗口中同期进行贪图和引申。对于好多编程任务,这很是灵验,但在万古候启动、大畛域并行或高度结构化的反抗任务中,偶然会出现问题。
原因在于,Claude 在单个高下文窗口中处理复杂任务时候越长,就越容易出现以下几类失败模式:
智能体懒惰(Agentic laziness):Claude 在处理复杂多设施任务时可能提前住手,声称任务完成,例如只处理 50 条安全审查中的 20 条。
自我偏好偏差(Self-preferential bias):Claude 倾向于偏向我方的结尾或发现,尤其在需要考证或评估时。
标的漂移(Goal drift):在多轮操作中,任务标的渐渐偏离,稀奇是在压缩总结之后,细节如边际案例或「辞谢作念 X」的敛迹可能丢失。
创建责任流不错通过为不同标的分派沉寂高下文窗口的 Claude 实例来幸免这些问题,每个实例专注、防止任务标的。
动态与静态责任流的区别
你可能之前使用 Claude Agent SDK 或 claude -p 创建过静态责任流,以配合多个 Claude Code 实例。
静态责任流需兼顾统统极点情况,因此庸俗更通用。而使用 Claude Opus 4.8 的动态责任流,Claude 当今大要生成针对你的特定用例定制的智能框架。

动态责任流的常用模式
你不错班师让 Claude 生成动态责任流,或者使用触发词「ultracode」确保 Claude Code 创建责任流。
交融动态责任流的常用模式,有助于判断何时使用以及如何通过提醒结合 Claude:

分类并引申(Classify-and-act):使用分类器 Agent 决定任务类型,然后根据任务路由到不同 Agent 或看成,也可在临了使用分类器判断输出。
分发并汇总(Fan-out-and-synthesize):将任务拆分红多个小设施,每个设施由一个 Agent 处理,然后汇总结尾。稀奇适合无数小设施或每步需要沉寂高下文的情况。汇总设施会恭候统统分发 Agent 完成,然后将结构化输出合并。
反抗性考证(Adversarial verification):每个子 Agent 的输出都由另一个 Agent 对照评判法子进行反抗性考证。
生成并筛选(Generate-and-filter):生成多个思法,然后根据评判法子筛选,去重,只复返高质料且考证过的思法。
竞赛(Tournament):让多个 Agent 以不同款式引申相同任务,再通过评判 Agent 两两比较结尾,选出最优。
轮回直到完成(Loop until done):对于责任量未知的任务,轮回生成 Agent,直到恬逸住手条件(无新发现或日记中无更多弱点),而非固定轮次。
用例

迁徙与重构
Bun 从 Zig 重写到 Rust,等于用 workflows 完成的。
要津是把任务拆成一系列不错冉冉处理的小单位,比如调用点、失败测试、模块等。每一个配置都在沉寂的 worktree 里派出一个子 Agent 去完成;之后再让另一个 Agent 作念反抗式审查,阐明没问题后再合并。
淌若但愿尽可能并行,又不思把本机资源打满,不错明确告诉 Agent 不要启动资源耗尽很高的敕令。
深度连系
咱们在 Claude Code 里发布了一个深度连系 skill(/deep-research),它使用的等于动态 workflows。
具体来说,它会并行张开网页搜索,持取府上来源,对其中的说法作念反抗式考证,临了整合成一份带援用的连系表露。
不外,这类连系并不单限于网页搜索。比如,你也不错让 Claude 从 Slack 的高下文里整理一份状况表露,或者让它深切浏览代码库,连系某个功能到底是如何达成的。
深度考证

另一方面,淌若你有一份表露,并但愿一一核查其中援用的每一项事实述说稀奇来源,你不错构建一套责任流:先由一个智能体负责识别出统统的事实述说,随后派生出一个子智能体,尊龙凯时2026世界杯中国官网对每一项述说进行扎眼的核查。此外,你还不错引入一个考证智能体,成心对负责溯源的子智能体进行复核,以确保其所援用的来源具备高质料。
排序

你可能会有一批要求,思按某种定性的法子来排序,而这个法子又是 Claude Code 比较擅长判断的。比如,把支撑工单按 bug 严重进程排序。
但淌若你思在一个 prompt 里一次性处理 1000 多行,质料很容易下落,何况高下文也放不下。更好的作念法是跑一场「锦标赛」:搭建一条由两两比较 Agent 构成的活水线。比较班师打全都分,两两比较庸俗更可靠。
也不错先并行分桶排序,再把结尾合并。每一次比较都交给一个沉寂 Agent 完成,详情趣的轮回负责爱戴通盘比赛括号,确凿留在高下文里的,只好现时正在引申的规章。
缅思与章程征服
尊龙凯时中国官网入口
淌若你发现存一组章程,即便写进 CLAUDE.md,Claude 仍然时常漏掉或引申不好,则不错成心作念一个责任流:把这些章程列出来,让考证 Agent 逐条查验。每条章程对应一个考证 Agent。
同期,再创建一个带有怀疑者视角的子 Agent,成心复核这些章程是否合理、是否的确对王人标的,这么不错减少过多误报。
反过来也成立:你不错从最近的会话和代码审查宗旨里,挖出那些你反复改换的问题;再让多个 Agent 并行归类整理;然后对每条候选章程作念反抗式考证,比如追问:这条章程其时的确能幸免一个确凿弱点吗?临了,把通过考证的章程再索求回 CLAUDE.md。
根因拜访
调试最灵验的方法,庸俗是先建议几个互相沉寂的假定,再一一考证。但淌若只依赖一个高下文窗口,Claude 很容易堕入某种「自我偏好」:越看越折服我方起先的判断。
责任流不错从结构上幸免这小数。它不错让多个 Agent 基于相互防止的笔据区别建议假定。比如,一个 Agent 只看日记,一个只看文献,一个只看数据。随后,每个假定再交给一组考证者和反驳者来老师。
这种方法并不单适用于代码。销售场景也不错用,比如分析 3 月销售额为什么下滑;数据工程也不错用,比如排查某条数据管谈为什么失败。任何需要作念复盘、找根因的问题,都不错用雷同的责任流来处理。
Triaging at scale
大畛域工单分拣

每个团队都濒临着支撑工单队伍、Bug 表露或其他积压任务,这些任务通常无法仅凭东谈主工完全处理。分流责任流(Triage workflow)大要对每一个待服务项进行分类,与已跟踪的要求进行去重比对,并遴选相应的行动。这些行动可能包括尝试班师配置问题,或者将其升级转交给东谈主工用户处理。
在分流责任流中,「防止」(Quarantine)是一种很是实用的模式。其中枢作念法是:辞谢那些负责读取非受信大众本色的智能体引申高权限操作;违反,这些高权限操作将交由成心负责基于信息遴选行动的智能体来引申。将分流责任流与 /loop 指示连合使用,即可让 Claude 持续不时地自动引申此类任务。
探索与回味判断
在探索针对某一处置决议的不同达成旅途时,责任流显得尤为有用 —— 稀奇是当任务波及主不雅「回味」判断(如设想或定名责任)且需要依据一套既定法子(Rubric)进行评估时。
不妨尝试让 Claude 探索并生成一系列潜在的处置决议,随后指派一个「评审智能体」,并为其提供一套明确的评估法子,用以界定何为「优质」的处置决议。当该评审智能体判定某决议已完全合适既定法子时,该任务即宣告完成。此外,还不错依据这套评估法子,通过「锦标赛」式的比拼机制对各样处置决议进行排序或最终筛选。
评估
你不错针对特定任务启动轻量级的评估经过:起先在沉寂的「责任树」(Worktree)中繁衍出一组智能体来引申任务;随后再繁衍出一组「对比智能体」,依据既定的评估法子对前述智能体生成的具体输出结尾进行比对与评分。例如而言,你不错利用这一机制,依据特定的评估法子,对你所创建的某项 Skill 进行评估,并在此基础上加以迭代优化。
模子与智能路由
你不错创建一个成心针对你的任务进行调优的「分类智能体」,由其负责决接应调用哪一个基础模子来引申任务。当你的任务波及无数的器具调用时,这一机制尤为实用 —— 通过在郑重引申任务前进行事先分析与调研,该分类智能体大要精确识别出最适合现时任务的基础模子。
例如来说,针对「评释认证模块(Auth module)的责任旨趣」这一任务,其最好的基础模子选拔并非一成不变,而是取决于该认证模块内包含的文献数目以及通盘代码库的举座结构形态。此时,分类智能体便可承担起这项事先分析的职责,并依据对任务预期复杂度的判断,将任务智能路由至 Sonnet 或 Opus 等不同的基础模子进行处理。
何时不宜使用动态责任流
「责任流」是一项相对较新的功能。尽管在好多应用场景下,它能带来渔人之利的显耀成效,但并非每一项任务都必须依赖责任流;若铺张责任流,反而可能导致耗尽远超预期的 Token 资源。
最好的本质战略是发达创意,以一种前所未有的款式天真诳骗责任流,从而充分挖掘 Claude Code 的潜能。对于老例的编程任务,不妨先自问一句:这项任务的确有必要干与异常的策画资源来启动责任流吗?例如,大多数传统的编码任务并不需要由五名审阅者构成的评审小组。
构建动态责任流的技巧
提醒词设想
针对动态责任流,若罗致咱们上文胪陈的特定技巧来编写扎眼的提醒词,通常能取得最好后果。
责任流并非仅适用于大型任务。你也不错通过提醒词指示,让模子引申一种「快速责任流」。比如你不错快速构建一个针对特定假定进行「反抗性审查」的责任流。
连合使用 /goal 与 /loop 指示。
当你需要引申可重叠的责任流(例如任务分流、府上调研或信息核实)时,建议搭配使用 /loop 指示以达成周期性引申,并连合 /goal 指示来设定明确的任务完成硬性目标。
Token 使用预算
你不错为动态责任流设定明确的 Token 使用预算,以此甩掉单项任务所耗尽的 Token 数目。你不错在提醒词中班师指定预算额度,例如输入:「use 10k tokens」(使用 10k Token),系统便会自动设定相应的上限。
保存与分享动态责任流
你不错通过在责任流菜单中按下「s」键来保存现时的责任流。你不错将这些责任流文献存档至~/.claude/workflows 目次下,也不错将其打包为「妙技」(Skill)的神志进行分发与分享。

若要通过妙技(Skill)来分享这些文献,请将你的 JavaScript 责任流文献放入该妙技对应的文献夹中,并在 SKILL.MD 文献中援用它们。为了取得更大的天真性,你可能但愿提醒 Claude 将该妙技中的责任流视为「模板」,而非必须一字一板引申的剧本。

责任流是一种有助于彭胀 Claude Code 的全新款式。大众应该将其视为一个起首 —— 对于如何充分发达其服从尊龙凯时2026世界杯中国官网,仍有好多值得探索之处。期待听到你的发现。
