标签:codex
共 2 篇
-
啤酒游戏:让 Claude 和 Codex 干了这杯酒
同一道啤酒游戏案例题、同一份 PDF,Claude 最初算出超额收益 500–1000 元,Codex 最初算出 7500–7900 元。我把两份答案互丢回去,让它们围绕“backorder 假设”和“期末库存估值口径”互评两轮。最后两边在主策略和收益量级上基本收敛,但中心值仍未完全统一。
-
我是怎么让 Claude 和 Codex 帮忙完成课程作业
这门《运营与供应链管理》课后有个「设施选址」的案例,我让 Claude 先做了一遍,又用 Codex 独立做了一遍,两个答案思路一致但数字和结论完全相反。把两份答案同时丢回 Claude 让它当裁判,结果它推翻了自己之前的解法——三处方法论错误被它一条条指出来,还配合 Python 独立验证给出了修订版。这篇记录一下这个「左右互博」的过程,和我为什么觉得它比让单一模型深挖要靠谱。