
近日,曾被视为最强 AI 编码器用之一的 Claude Code,碰到了前所未有的信任危急。带头提议质疑的,是 AMD 东说念主工智能部门的负责东说念主——她直言吐槽 Claude Code 越更新越差,不仅“变蠢”,还学会了偷懒摆烂。
不仅如斯,她更拿出了数万条骨子使用数据进行深度分析,实锤了这一说法。
一则 GitHub issue,引全网热议
这场争议的导火索,源于 4 月 2 日别称昵称为 stellaraccident 的用户,在 Claude Code 的 GitHub 格局页面上提交的一个问题反馈(Issue)。
她没绕任何弯子,径直在 issue 标题中就带着起火:“2 月份的更新导致 Claude Code 无法用于复杂的工程任务”。

证实该用户的 GitHub 个东说念主府上和磋议 Linkedln 帖子骄贵,这位发帖东说念主恰是芯片制造商 AMD 东说念主工智能部门足下 Stella Laurenzo。

她明确列出了更新后 Claude Code 的四大问题,号称“四宗罪”:
无视指示
宣称“最简短的开荒有诡计”,但其实是谬误的
扩充与要求相悖的操作
在未按要求完成的情况下宣称已完成
为了诠释我方并非随口吐槽,Stella Laurenzo 还拿出了团队几个月的使用日记,内部矜重纪录了 6852 次会话,这些会话包含了 234760 次器用调用和 17871 个念念维块。
所罕有据齐指向一个论断:2 月份之后的 Claude Code,即是在摆烂,稍稍复杂少量的工程活,根蒂信不外。
Claude Code 到底摆烂成什么样?
通过对会话文献的量化分析,Stella Laurenzo 指出:念念考内容脱敏功能(redact-thinking-2026-02-12)的上线,与复杂长会话工程责任流的质料退化,有着精确的对应关联。
数据骄贵,彭胀念念考 token 并非“诚心诚意”,而是模子扩充多体式洽商、顺从范例、细致修改代码的中枢必要条目。
一朝念念考深度镌汰,模子的器用使用模式就会从“先洽商后修改”,彰着转机为“径直修改”,这也径直激励了用户反馈的各种质料问题。
Stella Laurenzo 以过头团队基于以下几个维度剖析了 Claude Code 这几个月间的变化:
念念考内容荫藏时刻线与质料回退相吻合
从会话 JSONL 文献中对念念考块的分析恶果来看,变化更为直不雅:

拜访阐彰着示,质料退化问题于 3 月 8 日被独处上报,而这一天,偶合是脱敏念念考块占比碎裂 50% 的日子。据悉,脱敏功能是分阶段部署的,从 1.5% 徐徐进步至 25%、58.4%,最终在一周内达到 100%。
脱敏前念念考深度已大幅下落
1 月份时,Claude Code 每次念念考的内容约莫有 2200 个字符,能看出是在安祥琢磨问题。可到了 2 月底,念念考字符数径直暴跌至 720 个,相配于减少了三分之二的念念考量,念念考深度下落了 67%。

除了念念考偷懒,Stella Laurenzo 和 AMD 团队还检测了 Claude Code 的多项质料方向。
在念念考分析完成前,他们已基于 18000 + 用户教唆词独处诡计以下方向:
此外,他们也编写了 stop-phrase-guard.sh 住手钩子,用于自动检测推诿、提前住手、苦求许可等暗昧步履。
恶果骄贵,3 月 8 日后的 17 天内,这个钩子被触发了 173 次,而在此之前,从未被触发过。
另外,Claude Code 的责任魄力也发生了透彻转机,最中枢的变化即是修改代码的逻辑:以前它会先安祥阅读磋议文献,再动手修改,但对 234760 次器用调用的分析骄贵,目下的它,仍是不再先阅读代码再修改了。
拜访数据明晰地呈现了这一退化:1 月份时,Claude Code 改一次代码平均要读取 6.6 次文献,只怕出现谬误。这算是它的“细致期”,会先读取方向文献、关联文献,全局检索用法,放哨头文献与测试用例,再进行精确修改。
可到了 3 月底,它平均只读 2 次文献就敢径直动手修改,降幅跳跃 70%。这么一来,问题当然数见不鲜:仅读取当前文献就径直修改,络续忽略险阻文,进而出现乱插代码、艰涩原有凝视、重叠编写逻辑等问题,写出来的代码 Bug 满天飞。
许多范例员反馈,后续修改这些 Bug 的时刻,比我方重新写一段代码还要久。

除此除外,Claude Code 全新写入的占比翻倍,模子更倾向于重写通盘文献,而非精确修改。这么作念诚然速率更快,但会丢失精度与险阻文感知,反而失之东隅。

Stella Laurenzo 还进一部分分析了受影响的责任流,开云app主要包括:
50 + 并发代搭理话扩充系统编程(C、MLIR、GPU 驱动)
30 分钟以上自主运行,扩充复杂多文献修改
严格的格局范例(5000 + 字 CLAUDE.md 文档)
代码评审、工单贬责、迭代调试
细致期单周末同一 19.1 万行代码
其指出,彭胀念念考是模子竣事以下才能的核神思制:
行径前贪图多体式有诡计(读取文献、扩充规则)
recalling 并罢职格局范例
输出前自我查验谬误
判断任务是否完成、会话是否络续
数百次器用调用中保捏逻辑连贯
而当念念考深度不实时,模子就会遴选最省力的操作:不读取文献径直修改、未完成任务就住手、推诿包袱、用最简短的有诡计替代正确有诡计。
从 2 月到 3 月,Claude Code API 苦求量径直暴涨了 80 倍,输出的 token 也加多了 64 倍。据估算,每月的使用资本从几百好意思元,径直飙升到 4 万多好意思元。本来想省单次念念考的算力,恶果因为 Claude Code 反复改错、需要按捺重试,反而让全体资本径直失控,简直是失掉赚吆喝。

诉求:诚然我已换了其他大模子,但如故但愿 Anthropic 能开荒居品
濒临这么的恶果,Stella Laurenzo 示意,这不是她一个东说念主遇到的问题,况且情况仍是严重到无法在责任环境中络续使用 Claude Code 的地步。
她说说念:“咱们的责任环境复杂度高且瓦解,通过挖掘数月日记,咱们明确了问题的根源——自 2026 年 2 月起,Claude 已无法可靠完成复杂工程任务。团队扫数资深工程师均反馈了肖似问题,其中一位工程师领有可复现的测试历程,咱们基于其日记开展本质与数据分析,且已尝试扫数公开的变通有诡计。”
在 Stella 看来,我方发布这份反馈,并不是为了抹黑 Anthropic,而是诚意但愿他们能爱重这个问题,转圜 Claude Code 这个也曾的好居品。“咱们已切换至其他管事商,其管事质料更优,但 Claude 曾为咱们提供细致维持,因此提交此问题,但愿 Anthropic 能开荒居品。”
对此开云体育,其提议了四个建议:
对于念念考资源分拨的透明度:如果念念考 token 被减少或设上限,依赖深度推理的用户需要知情。目下的 redact-thinking header 让外部无法考据这少量。
“最大念念考”等第:扩充复杂工程责任流的用户兴奋为保证深度推理付出更高用度。目下的订阅模式莫得隔离需要每次 200 个念念考 token 的用户和需要 20,000 个的用户。
API 反应中的念念考 token 方向:即使念念考内容被荫藏,如果在使用情况反应中通晓 thinking_tokens,用户仍可监控我方的苦求是否得到了所需的推理深度。
高阶用户的金丝雀方向:住手钩子违纪率(从 0 → 每天 10 次)是一个可机器读取的信号,不错在通盘用户群体中监控,四肢质料回退的当先方向。
网友吐槽:从“封神”到“劝退”,落差太大
不光 AMD 这位高管,全网的范例员们看到这份反馈后,像是找到了组织,磋议区里一派哀嚎。
有东说念主示意,这段时刻一直怀疑是我方时现时滑了,写代码总被 Claude Code 带偏,直到看到这份反馈才知说念,原本全球齐有相似的困扰。
四肢 Claude 也曾的诚笃用户,范例员 bbecausereasonss 在 Reddit 上发帖称:“我仍是无法再快慰理得地向客户推选 Claude Code 了。”
他示意:“我是 MAX 用户。刚驱动使用 Claude Code 时,我竟然被颠簸到了。自 2022 年以来我一直在用 AI 作念开发,这一次确乎让我嗅觉像是一个进击的历史时刻。我也曾把 Claude Code 推选进客户的格局和开发历程中,在酬酢媒体上狂放推奖它,也在私行里按捺安利给身边的东说念主。”
但他话锋一行,吐槽当前版块的模子情状:“懒惰、无知、才能退化且视线局促,在还莫得确切息争全体问题和多样限度情况之前,就盲目驱动‘开荒’——况且大多半补丁反而把事情搞得更糟。我仍是无法再负包袱地络续推选它了,因为这只会让我看起来像个痴人,大略在瞎掰八说念,致使两者兼具。”
他还直言:“Claude Opus 在往日几周简直是一场苦难——致使还没提到使用额度的问题。一个很贴切的比方是,它像是被‘作念了脑叶切除手术’,身手从 135–150 径直掉到 90–100,嗅觉退化成了 Sonnet 3.5。竟然很失望。”
还有东说念主追问 Stella Laurenzo 究竟在用什么模子替代 Claude Code:
“Claude 仍是退化到无法被信任去完成复杂工程任务的地步。”
差未几,但我以为更准确的说法是:Claude 仍是退化到连任何工程任务齐不值得信任的进程了。
它从来莫得一次就把事情作念对过,写出来的代码充满 bug 和重叠逻辑,况且必须全程盯着,不然它一定会把东西搞坏。
它仍是酿成了另一个 AI“玩物”。挺可惜的。
能否共享一下你在用的“其他器用”?我也想试试。
不外,Stella Laurenzo 并莫得指出我方用的是哪款模子替代。而是补充说说念:「在 6 个月前,Claude 在推理质料和扩充才能上简直是唯独档的。但目下,其他竞品也需要被终点安祥地重新评估。就才能层级而言,Anthropic 早已不再是唯逐个个处在 Claude Opus 也曾方位水平的玩家。」
目下网友们的呼声其实很一致:对于 AI 编程助手,不错禁受它慢少量,但齐备不可禁受它变蠢、变懒,更不可禁受它敷衍唐塞。毕竟全球用 AI 编程助手,不是想要一个“快但错”的打字机,而是想要一个能沿途念念考、能扛事的队友,若是连最基本的念念考齐没了,那这个器用,也就失去了它存在的兴味。
对此,你在使用 Claude Code 有什么样的感受?
BET365体育官方网站
备案号: