开云体育 Claude越更越废？AMD AI负责东说念主甩出23万次调用纪录：已“变蠢+摆烂”，复杂工程根蒂干不了

近日，曾被视为最强 AI 编码器用之一的 Claude Code，碰到了前所未有的信任危急。带头提议质疑的，是 AMD 东说念主工智能部门的负责东说念主——她直言吐槽 Claude Code 越更新越差，不仅“变蠢”，还学会了偷懒摆烂。

不仅如斯，她更拿出了数万条骨子使用数据进行深度分析，实锤了这一说法。

一则 GitHub issue，引全网热议

这场争议的导火索，源于 4 月 2 日别称昵称为 stellaraccident 的用户，在 Claude Code 的 GitHub 格局页面上提交的一个问题反馈（Issue）。

她没绕任何弯子，径直在 issue 标题中就带着起火：“2 月份的更新导致 Claude Code 无法用于复杂的工程任务”。

证实该用户的 GitHub 个东说念主府上和磋议 Linkedln 帖子骄贵，这位发帖东说念主恰是芯片制造商 AMD 东说念主工智能部门足下 Stella Laurenzo。

她明确列出了更新后 Claude Code 的四大问题，号称“四宗罪”：

无视指示

宣称“最简短的开荒有诡计”，但其实是谬误的

扩充与要求相悖的操作

在未按要求完成的情况下宣称已完成

为了诠释我方并非随口吐槽，Stella Laurenzo 还拿出了团队几个月的使用日记，内部矜重纪录了 6852 次会话，这些会话包含了 234760 次器用调用和 17871 个念念维块。

所罕有据齐指向一个论断：2 月份之后的 Claude Code，即是在摆烂，稍稍复杂少量的工程活，根蒂信不外。

Claude Code 到底摆烂成什么样？

通过对会话文献的量化分析，Stella Laurenzo 指出：念念考内容脱敏功能（redact-thinking-2026-02-12）的上线，与复杂长会话工程责任流的质料退化，有着精确的对应关联。

数据骄贵，彭胀念念考 token 并非“诚心诚意”，而是模子扩充多体式洽商、顺从范例、细致修改代码的中枢必要条目。

一朝念念考深度镌汰，模子的器用使用模式就会从“先洽商后修改”，彰着转机为“径直修改”，这也径直激励了用户反馈的各种质料问题。

Stella Laurenzo 以过头团队基于以下几个维度剖析了 Claude Code 这几个月间的变化：

念念考内容荫藏时刻线与质料回退相吻合

从会话 JSONL 文献中对念念考块的分析恶果来看，变化更为直不雅：

拜访阐彰着示，质料退化问题于 3 月 8 日被独处上报，而这一天，偶合是脱敏念念考块占比碎裂 50% 的日子。据悉，脱敏功能是分阶段部署的，从 1.5% 徐徐进步至 25%、58.4%，最终在一周内达到 100%。

脱敏前念念考深度已大幅下落

1 月份时，Claude Code 每次念念考的内容约莫有 2200 个字符，能看出是在安祥琢磨问题。可到了 2 月底，念念考字符数径直暴跌至 720 个，相配于减少了三分之二的念念考量，念念考深度下落了 67%。

除了念念考偷懒，Stella Laurenzo 和 AMD 团队还检测了 Claude Code 的多项质料方向。

在念念考分析完成前，他们已基于 18000 + 用户教唆词独处诡计以下方向：

此外，他们也编写了 stop-phrase-guard.sh 住手钩子，用于自动检测推诿、提前住手、苦求许可等暗昧步履。

恶果骄贵，3 月 8 日后的 17 天内，这个钩子被触发了 173 次，而在此之前，从未被触发过。

另外，Claude Code 的责任魄力也发生了透彻转机，最中枢的变化即是修改代码的逻辑：以前它会先安祥阅读磋议文献，再动手修改，但对 234760 次器用调用的分析骄贵，目下的它，仍是不再先阅读代码再修改了。

拜访数据明晰地呈现了这一退化：1 月份时，Claude Code 改一次代码平均要读取 6.6 次文献，只怕出现谬误。这算是它的“细致期”，会先读取方向文献、关联文献，全局检索用法，放哨头文献与测试用例，再进行精确修改。

可到了 3 月底，它平均只读 2 次文献就敢径直动手修改，降幅跳跃 70%。这么一来，问题当然数见不鲜：仅读取当前文献就径直修改，络续忽略险阻文，进而出现乱插代码、艰涩原有凝视、重叠编写逻辑等问题，写出来的代码 Bug 满天飞。

许多范例员反馈，后续修改这些 Bug 的时刻，比我方重新写一段代码还要久。

除此除外，Claude Code 全新写入的占比翻倍，模子更倾向于重写通盘文献，而非精确修改。这么作念诚然速率更快，但会丢失精度与险阻文感知，反而失之东隅。

Stella Laurenzo 还进一部分分析了受影响的责任流，开云app主要包括：

50 + 并发代搭理话扩充系统编程（C、MLIR、GPU 驱动）

30 分钟以上自主运行，扩充复杂多文献修改

严格的格局范例（5000 + 字 CLAUDE.md 文档）

代码评审、工单贬责、迭代调试

细致期单周末同一 19.1 万行代码

其指出，彭胀念念考是模子竣事以下才能的核神思制：

行径前贪图多体式有诡计（读取文献、扩充规则）

recalling 并罢职格局范例

输出前自我查验谬误

判断任务是否完成、会话是否络续

数百次器用调用中保捏逻辑连贯

而当念念考深度不实时，模子就会遴选最省力的操作：不读取文献径直修改、未完成任务就住手、推诿包袱、用最简短的有诡计替代正确有诡计。

从 2 月到 3 月，Claude Code API 苦求量径直暴涨了 80 倍，输出的 token 也加多了 64 倍。据估算，每月的使用资本从几百好意思元，径直飙升到 4 万多好意思元。本来想省单次念念考的算力，恶果因为 Claude Code 反复改错、需要按捺重试，反而让全体资本径直失控，简直是失掉赚吆喝。

诉求：诚然我已换了其他大模子，但如故但愿 Anthropic 能开荒居品

濒临这么的恶果，Stella Laurenzo 示意，这不是她一个东说念主遇到的问题，况且情况仍是严重到无法在责任环境中络续使用 Claude Code 的地步。

她说说念：“咱们的责任环境复杂度高且瓦解，通过挖掘数月日记，咱们明确了问题的根源——自 2026 年 2 月起，Claude 已无法可靠完成复杂工程任务。团队扫数资深工程师均反馈了肖似问题，其中一位工程师领有可复现的测试历程，咱们基于其日记开展本质与数据分析，且已尝试扫数公开的变通有诡计。”

在 Stella 看来，我方发布这份反馈，并不是为了抹黑 Anthropic，而是诚意但愿他们能爱重这个问题，转圜 Claude Code 这个也曾的好居品。“咱们已切换至其他管事商，其管事质料更优，但 Claude 曾为咱们提供细致维持，因此提交此问题，但愿 Anthropic 能开荒居品。”

对此开云体育，其提议了四个建议：

对于念念考资源分拨的透明度：如果念念考 token 被减少或设上限，依赖深度推理的用户需要知情。目下的 redact-thinking header 让外部无法考据这少量。

“最大念念考”等第：扩充复杂工程责任流的用户兴奋为保证深度推理付出更高用度。目下的订阅模式莫得隔离需要每次 200 个念念考 token 的用户和需要 20，000 个的用户。

API 反应中的念念考 token 方向：即使念念考内容被荫藏，如果在使用情况反应中通晓 thinking_tokens，用户仍可监控我方的苦求是否得到了所需的推理深度。

高阶用户的金丝雀方向：住手钩子违纪率（从 0 → 每天 10 次）是一个可机器读取的信号，不错在通盘用户群体中监控，四肢质料回退的当先方向。

网友吐槽：从“封神”到“劝退”，落差太大

不光 AMD 这位高管，全网的范例员们看到这份反馈后，像是找到了组织，磋议区里一派哀嚎。

有东说念主示意，这段时刻一直怀疑是我方时现时滑了，写代码总被 Claude Code 带偏，直到看到这份反馈才知说念，原本全球齐有相似的困扰。

四肢 Claude 也曾的诚笃用户，范例员 bbecausereasonss 在 Reddit 上发帖称：“我仍是无法再快慰理得地向客户推选 Claude Code 了。”

他示意：“我是 MAX 用户。刚驱动使用 Claude Code 时，我竟然被颠簸到了。自 2022 年以来我一直在用 AI 作念开发，这一次确乎让我嗅觉像是一个进击的历史时刻。我也曾把 Claude Code 推选进客户的格局和开发历程中，在酬酢媒体上狂放推奖它，也在私行里按捺安利给身边的东说念主。”

但他话锋一行，吐槽当前版块的模子情状：“懒惰、无知、才能退化且视线局促，在还莫得确切息争全体问题和多样限度情况之前，就盲目驱动‘开荒’——况且大多半补丁反而把事情搞得更糟。我仍是无法再负包袱地络续推选它了，因为这只会让我看起来像个痴人，大略在瞎掰八说念，致使两者兼具。”

他还直言：“Claude Opus 在往日几周简直是一场苦难——致使还没提到使用额度的问题。一个很贴切的比方是，它像是被‘作念了脑叶切除手术’，身手从 135–150 径直掉到 90–100，嗅觉退化成了 Sonnet 3.5。竟然很失望。”

还有东说念主追问 Stella Laurenzo 究竟在用什么模子替代 Claude Code：

“Claude 仍是退化到无法被信任去完成复杂工程任务的地步。”

差未几，但我以为更准确的说法是：Claude 仍是退化到连任何工程任务齐不值得信任的进程了。

它从来莫得一次就把事情作念对过，写出来的代码充满 bug 和重叠逻辑，况且必须全程盯着，不然它一定会把东西搞坏。

它仍是酿成了另一个 AI“玩物”。挺可惜的。

能否共享一下你在用的“其他器用”？我也想试试。

不外，Stella Laurenzo 并莫得指出我方用的是哪款模子替代。而是补充说说念：「在 6 个月前，Claude 在推理质料和扩充才能上简直是唯独档的。但目下，其他竞品也需要被终点安祥地重新评估。就才能层级而言，Anthropic 早已不再是唯逐个个处在 Claude Opus 也曾方位水平的玩家。」

目下网友们的呼声其实很一致：对于 AI 编程助手，不错禁受它慢少量，但齐备不可禁受它变蠢、变懒，更不可禁受它敷衍唐塞。毕竟全球用 AI 编程助手，不是想要一个“快但错”的打字机，而是想要一个能沿途念念考、能扛事的队友，若是连最基本的念念考齐没了，那这个器用，也就失去了它存在的兴味。

对此，你在使用 Claude Code 有什么样的感受？

BET365体育官方网站