人机协同下的
专业进阶之道
影之刃零版本支持中的 agentic workflow 探索
相较于功能,AI 更像是地基
就像房子的水、电、wifi——我们不会讨论"这个房子有没有电",因为没有电的房子根本没法住
未来我们也会越来越少孤立地讨论 AI,因为我们做的每一件事,背后都有它
从"功能"到"地基"
Acknowledge
感谢部门团队同行,提供的一切资源和基建
初面新物种:主打一个心情复杂
任何东西初接触时,都会遇到学习曲线的问题——
尤其 agent,具备一定(拟人)的硅基智慧
对于我们来说,可能是无感,到心态复杂 | 微妙变化
"失重感"
这些对话,发生在一周之内——都是大家对 AI 冲击的隐忧
新人无路可练
远超人对其的判断
没有真正的价值判断
难以显性化注入
我们的心态:无感 → 震惊 · 兴奋,伴随焦虑|难以理解,习惯性抗拒
两个问题|非常规方法
面对处在非常时期的产品,我们也只能选择非常规的方法
研发反复 delay,研究规划一再延后、调整——项目时间上的紧张感扑面而来
影零项目情境
我们既幸运也不幸运——好的一面,是玩得进度最早最多的人;不好的一面,玩的是最破碎的版本
因此,我们所想
- 尽可能减少团队的消耗,给研发的投入做减法
- 给我们的行动增加开放度、透明度
- 提供最可靠、最关键的洞察与专业建议
- 明确的:第一次长线陪伴一个国单买断制内容游戏
- 被动的:版本意外推延,我们也是承压团队
用研作为研发合作伙伴,本身的立场就是——让大家以最低成本瞥见一眼未来
项目的规划与架构
解放注意力带宽,让研究者回到"每一个当下"
研究员角色从"执行者"升级为"标准制定者"
包括对于保密的标准
买断制内容型游戏的特殊性——
需要让真实玩家在远早于市场曝光的时间,获得相当长的体验
一开始就锁定低风险池——基于 AI 也是为了避免人的 bias 和考虑盲区


在执行框架的结构设计上,发挥 agent 长板
具体来说,在项目启动时,我们就和 AI 一起设计了整个项目的数据结构



每日记录与每天的体验任务 checkpoint 紧密对应——AI 处理时效率非常高,因为它清楚每条信息归到哪个维度、以什么形式输出
AI 协作最有价值的起点,是 "一起设计结构"——先把分析脚手架搭好,后面的一切才能高效运转
"洞察与呈现分离"的架构思维
我们建立了一个重要的工作环境——将"分析(洞察)"与"呈现"跑在两个分支
- 每日用户反馈记录与分析
- 专家角色参与观点精炼:"用户说‘地图引导差’是标识、还是关卡设计问题?原话能区分吗?"
- 产出每日的观察判断
- 同一洞察 → 适配不同受众 生成相应每日小结 / 看板 / 摘要
- 屏蔽观点迭代中不需要的历史结果
- 用更干净的上下文保证 agent 注意力
研究员专注于洞察判断 · 呈现适配下放给 agent · 洞察更新时所有呈现同步刷新
做好 agentic 架构,最大的价值就在于:
解放我们自己的注意力带宽
——让研究者回到"每一个当下"
研究者不用分心于记录、整理、排版时,注意力可以更完整地留在用户身上
尤其对于连续 3 天内容体验这样的长时间 CE,对用户的理解深度和细节把握,会产生质的提升
项目的执行推进与业务协同
增强分析纵深——用户理解的全景拼合
好的 agentic 流程能保证效率,但只有效率也不够
每天晚上需要产出一份当日的研究小结——
8 个用户一整天的行为观察、关键反馈,整合成一份有洞察的文档
研究员负责记录和判断 · AI 负责整合和结构化输出
CE 测试产出的信息是多维的——
需要的不只是速度,还有严谨性
日更小结
因此需要在早期对定性分析,给定编码规范
我们对用户的定性反馈如何分析,给定了编码的规范
编码脚手架
方向与权重
溯源用户的表达立场与身份
例如:用户说"养成体验不好" — 是资源问题/引导/系统设计?还是多因素耦合?
搭建 AI 输出的"信息溯源"机制
对不同来源的信息,做了权重上的区隔
权重自上而下递减
越往后,用户体验时间越长——他们的反馈是建立在更充分的版本信息认知之上的
更符合 agent 对上下文注意力的分配
AI 撰写分析时遵循该权重体系——每个结论都能对应具体、可信的信息来源
全景拼合的前提是——溯源机制能保障信息源不会被污染数据扭曲
交互式看板替代传统文档传阅
AI 输出的每日小结是结构化数据——可以直接喂入项目看板
_6dd1ba04.png)
_ce21ee66.png)

Agent 帮研究员加速了"全景拼合"的过程——
让研究员更快抵达全景视角
把多维数据的关联性快速拉出来
增强分析纵深的前提,是严谨性有制度保障
用户洞察与业务影响
让影响力发生在当下
改变研究发现"被看见"的时间
无论架构规划、过程管理多么完善——研究最终的价值,还是要回到项目影响
对影零的支持,在所剩无几的带宽中更加关键——
所以从早期我们就在打算:改变研究发现"被看见"的时间
从"节点交付"到"持续交付"
做完后才交付
仅一份最终报告
影响力集中在末端
边做边交付——AI 驱动的实时看板和结构化数据流
从测试第一天起,研发团队就能看到
参会用户构成 / 每日进展 / 体验问题矩阵
同一份洞察,通过看板、摘要等多种形式触达不同决策者——影响力通过多触点覆盖被放大了
"多阶段渐进式生产"让报告产出的每步锚点更受控
最终报告所承担的价值,有相当一部分已经被前移了
最终产出更像一个形式上的讨论材料:有空间增加更多针对问题优先级和影响的判断|提出更多 what-if|促进团队共识
我们能分享的较优路线 — one thing a single step, rule of three
之后人为接手精修
减少"抽卡依赖"——增加过程的 harness
更高频的 restatement——主动在每个节点上对记忆做全量召回(类似 system prompt 级别的权重)
为什么听起来这么"绝望"
其实探索过程仍是有趣的,当前卡点更多在 agent 能力,而非工程策略
——我们仍可对发展抱有信心
不被排版美化分散精力
但方向错了"的浪费
先验证骨架,再投入美化——迭代速度更快,试错成本更低
产出交付与研究资产沉淀
获取项目资产与洞察的复利
让项目经验沉淀为研究资产,形成知识飞轮
我们把项目过程中摸索出的方法论编写成 10 个结构化的知识模块
团队做的每一个项目都在让 AI 变得更强——这就是飞轮
持续完善 Agentic Workflow,沉淀团队记忆
Agentic 沉淀,与传统用研沉淀的最大区别——
由"形式"走向"实用"的一步巨大跨越
- 一次性集中产出
- 之后 束之高阁
- 知识依附于人,易流失
- 每次方法论迭代实时更新到知识库
- 每次标准的完善都被记住
- 知识不依赖于人
AI 扮演了"团队记忆"的角色——它记住了所有方法论、设计规范、历史决策
知识不会因为时间流逝或人员变动而丢失
最后,是一些思考和 tricks
短期理性,长期乐观;卡点是行业的卡点,不是工程的
我应该如何开始用 agents、用 skills
这个东西没有那么高深——拿 skill 做一个拟人的表达,归根结底他是一个标准化工程的说明书
规则(指令)调用的自动化载体
减少重复性的指令交代 规范解释
减少重复劳动 · 提升精准度 优化上下文资源占用
就像运动器材的 fitting——减少你在行动中的肌肉劳损
什么时候用 agent,什么时候用脚本
需求的确定性和任务复杂度,决定了你该用哪种方式 — 不是 agent 越多越好
最便宜最稳
用 workflow 编排,不需 reasoning
分类、抽取、改写等
性质变难+标准抬升——Agent 交付永无止境的最后一公里
Agent 从 demo 走向真正落地,最大的难点已经从 "能不能执行任务" 变成 "能不能完成收尾" —— 这件事没有终点
最后 10% 是判断 / 取舍 / 验证 / 交付高价值密度
—— 而且,"足够好"的定义在同步前移
AI 能快速处理大量低密度执行任务,但决定质量的是少数高密度交付环节 · 今天的 99 分,明年可能只是 50 分
AI 没有消除最后一公里,反而让它成为价值最高的环节
定调的总结
短期,AI 的预期不妨理性
长远我们还是非常乐观
虽然 AI 很强,但请不要放弃逻辑能力
- writing 能力
- 构建 context 的能力
- 控制熵增——更精准描述问题、需求、知识
- connecting the dots
我们的卡点,也是行业的"卡点"
- memory degradation
上下文注意力衰减 - lost in the middle
记忆召回效果 - 多条指令对注意力带宽的挤占和争夺
- 全局 .md 文档、RAG 带来的指数级消耗上升
高度可标准化、重复性的任务
- 基础问卷
- 用户招募表
- 执行文档类产出
需求与产出预期可高度被标准化、明盘
"隐性判断层"——即便 SOTA 模型也很难
- 把控观点的火候 / 颗粒度
- 优化 PPT 叙事的观点密度和取舍
工具最需要的是确定性,一致性
——agent 作为工具本身,仍有很大"提升"空间
Thanks
人机协同下的专业进阶之道
影之刃零版本支持中的 agentic workflow 探索