浏览器运行环境异常,请检查是否开启本站的JavaScript权限或下载最新版浏览器
综合
文章
漫画
圈子
热榜
帮助
签到
创作
极速下载
资源区
学习区
专栏区
无标题文章
5
2
2
收藏
举报
分享

[Stable] 推理SKILL

想必用过grill-me的大部分人,都会觉得它还是很好用的。

我也觉得这个技能不错,于是开始不定期研究和收集一些相关资料。

首先拆解了grill-me技能,得出要素:
- Interview
- plan or design
- until
- shared understanding
- branch, tree

然后我想打造一个元认知技能,参考上面的要素。

reason-loop 包含了一套系统工程推理框架,而 grill-me 并不具备这些:
- 思维树(Tree of Thoughts):将复杂问题解构,同时生成 2~4 条截然不同的路径,并基于可行性、风险和证伪成本进行修剪。
- 双重设计(Design Twice):任何重要架构必须设计两套在结构、假设上本质相异的方案(例如:传统稳健派 vs. 颠覆创新派)进行并排对比。
- 多角色博弈(Collaborative Design):AI 内部模拟怀疑论者(挑刺假设)、实用主义者(极简路径)、用户(使用痛点)、创新者(被忽略的方案)进行多角度博弈。
- 硬核反思(Challenge Answer):拒绝万能套话(如 "It depends"),要求参数化的验证和具体收益证明,从最强的反向观点攻击已有结论。

以上的改造工作,都建立在巨人的肩膀上,所以在这里免费分享出来。

近期改动:
- 旧版已经归档,不会继续更新。
- 使用打分器来评分SKILL.md的质量,这样进一步压缩了脚本版中的SKILL.md文件并保持高质量。
- 完善python脚本的边界拦截。继续使用评分器,改善了所有文档的质量。
- 补了 Answer Contract 和 Switch Notes,把“什么时候收束回答、什么时候切换子笔记”说清楚。
- 补了“卡住时切到哪份 note”以及标准输出末句 winner / fallback / success check。
- 把文档和 scripts/reason_loop.py 的真实字段补齐了,尤其是 helper fields、state_transition、decision 记录。
- 加了 Forcing Functions,强制把第二方案拉开结构差异,避免伪双方案。
- 修掉了一处逻辑反向的句子,并补了 explore / ask / act 输出标签。

当前版本的评分如下,全部 >= 90:
  - SKILL.md => 90
  - challenge-protocol.md => 96
  - decision-note-schema.md => 90
  - decision-tree.md => 98
  - design-twice.md => 92
  - few-shot.md => 90
  - quickstart.md => 92
  - state-transition.md => 94
  - uncertainty-threshold.md => 92

 

适合执行命令强的模型

2条评论
有没有大神路过,可以给点建议或者尝试用它来攻克高性能矩阵乘法。
logo
有维咔App就够了
随时随地发现资源,免去网页端烦恼广告
打开App