文章摘要
针对 2026 年 5 月关于 rsync 维护者使用 Claude 导致软件质量下降的舆论风暴,作者进行了一项基于 36 个历史版本的实证研究。研究采用“每十次提交的漏洞数”作为核心指标,并咨询统计学专家使用了置换检验和费舍尔精确检验。结果显示,包含 AI 提交的版本在统计学上并未超出历史波动范围,其 p 值远高于显著性阈值。作者认为,虽然 AI 辅助开发引发了社区的“感知危机”,但数据并不支持 AI 导致了更多 Bug 的结论。
社区讨论
社区讨论呈现两极分化:支持者赞赏作者引入统计学方法来对抗情绪化批评;反对者则认为单一指标无法衡量 AI 代码带来的技术债、复杂性增加以及对用户信任的破坏。部分评论指出,即便 Bug 数量没变,关键工作流的断裂和开发模式的转变依然让长期用户感到不安。此外,作者对反对者的激进言辞也引发了关于讨论礼仪的争议。