Essay · 2026

当造假率达到 89.4%，"真"就成了统计学的少数派

一则关于学术、判断与剩余真实的札记

栋哥 · 2026.05.14 · 13:07 · 阅读 ···

🎧 朗读版 · 栋哥召唤 · 35分57秒

引子

89.4%。

这不是某个边缘领域的丑闻，也不是某个倒霉学校的塌方。这是一个国家学术系统的整体诊断。十年前是 2.1%,十年后是 89.4%——这不是恶化,这是相变。是水变成蒸汽,是固态崩成液态,是一个系统从"以真为常态、以假为例外"翻转为"以假为常态、以真为例外"的相变临界点。

需要把话说得更狠一点:当造假率达到 89.4%,"真"已经不再是默认值,而是异常值。 一个真实的研究在这个池子里被发现的概率,比一个造假研究被揭穿的概率还低。诚实成了统计学的少数派,成了需要被解释的偏差。

这意味着学术系统作为"知识生产装置"的功能已经死亡。它还在运转,还在出论文,还在评职称,还在分配经费——但它不再生产知识。它生产的是论文形状的废料,是带着脚注的废纸,是穿着学术外衣的市场行为。

更冷的是:这个系统不知道自己已经死了。 它仍然在按照"知识生产"的剧本走流程——开题、答辩、盲审、引用、影响因子——每一个环节都在认真扮演自己的角色,仿佛中间流动的真的是真理。这就像一具尸体仍然保持着呼吸的动作,肺已经停了,但胸腔还在起伏。

上篇 · 学术造假作为结构胜利

第一节

这不是道德崩坏,是结构胜利

把这件事归结为"学者堕落了""底线没了""人心不古了"——这是最廉价、也最有保护性的解释。

廉价,是因为它把一个系统问题转译成个体问题,让所有结构性的追责都停在被抓的倒霉蛋身上。保护性,是因为它让系统本身得以毫发无损地延续——每一次"严惩造假"的运动,每一次撤稿的新闻,每一次对个别败类的口诛笔伐,都在为系统延寿。它制造了"问题正在被解决"的幻觉,而真正让 2.1% 变成 89.4% 的那些条件,一个都没动。

那些条件是什么?

正反馈:论文带来职称,职称带来资源,资源带来更多论文产能。一个进入这个循环的人,停下来就是死,加速就是活。
叙事共识:科研产出等于学术水平。所有人——评审、行政、家长、学生——都接受这个公式,没有人质疑分子和分母是否匹配。
长反馈延迟:一篇造假论文从发表到被揭穿,通常需要 5-10 年,而在这之前它已经被引用、被评奖、被写进简历、换成了房子和户口。当惩罚滞后于收益十年,造假就不再是冒险,而是套利。
纠错信号缺失:撤稿率万分之几,被举报后真正调查的更少,调查后真正处理的更少。系统对造假的"痛感"接近零。
利益锁定:高校需要论文换排名,期刊需要论文换利润,论文工厂需要论文换现金,评审人需要论文换人情。每一个角色都从这个游戏里拿到自己那份,没有任何一方有动力打破它。

五个条件齐备时,系统不会缓慢恶化——它会指数级崩塌。从 2.1% 到 89.4%,看起来是十年滑坡,本质是一个被组织起来的、按工程标准搭建的失败装置在按时交付它的成果。

这不是失控,这是按设计运行。

最冷的事实是:在这个系统里,不造假的人是结构性失败者。 一个老老实实做实验、出来不显著就承认不显著的研究者,在这个系统里得不到职称、得不到经费、得不到学生、得不到下一个项目。系统在用筛选机制告诉所有人:诚实是一种奢侈品,只有不需要在这个系统里生存的人才负担得起。于是诚实者被自然淘汰,造假者被自然选择——这是达尔文式的,不是道德的。

谁还在喊"加强学术道德建设",谁就是在火灾现场讨论窗帘的颜色。

第二节

AI 让所有人都成为调用者,于是判断成为唯一的剩余价值

我此前提过一个观察:作者的角色,本质上是选择调用哪一个生成过程;最深层的控制权,不在直接产出结果,而在塑造产出的概率场。

这是一个中性的描述。它解释了为什么算法艺术是艺术,为什么参数化设计是设计,为什么"按下生成键"也可以是创作——因为创作的位置在更上游,在"选择哪个种子、哪个模型、哪条路径"那里。

但 AI 大降智阶段把这个机制推到了一个极端:当调用门槛降到零,调用本身就丧失了价值锚点。

输入一段 prompt,生成符合流行病学分布的虚拟患者数据;输入几个关键词,生成带有适当噪音的训练曲线;输入研究方向,生成完整论文骨架。这些动作和"创作"在物理上没有任何区别——都是输入提示、调用模型、获得输出。区别只在一个东西:调用者有没有判断力。

一个有判断力的调用者,知道自己在调什么、为什么调、得到的结果意味着什么、它在更大的知识网络里能落到哪里。一个没有判断力的调用者,只是在按动一台他不理解的机器,把吐出来的东西包装成自己的成果。

前者是创作,后者是诈骗。形式上完全相同,本质上完全相反。

这就是为什么"算法雕塑三能力模型"——数学/算法素养、空间审美判断、工程实现能力——在这个时代变得空前重要。这三者的交汇处是判断力的栖身之所。没有这三种能力支撑的"调用",就是空壳调用,是把生成过程当成提款机,是把"我按了按钮"误认为"我创造了作品"。

89.4% 的造假率,本质上是 89.4% 的空壳调用率。是一个时代的人,集体丧失了对自己所调用的过程的判断力,却还在批量产出"作品"。

更尖锐的问题是:当空壳调用成为常态,剩下的少数有判断力的调用者,反而要承担证明自己"不是 AI"、"不是造假"、"不是流水线产品"的举证责任。 真实者要为自己的真实辩护,要拿出证据证明自己不是那 89.4% 的一员——这是一个荒诞但已经在发生的反转。

第三节

所有的"完整"都值得怀疑

这是这件事在方法论上最深的一击。

那些用来识别造假的统计学工具——本福特定律、P-hacking 检测、末位数字偏好、误差棒一致性、训练曲线的平滑度——它们的共同逻辑是什么?

它们检测的,全是"过度完整"。

真实世界的数据是"去完整"的——有噪音、有抖动、有不均匀、有解释不了的离群点、有随机偏移。造假数据反而追求完整、规整、平滑、对称。一条完美的收敛曲线,一组首位数字均匀分布的统计表,一份末位数字大量集中在 0 和 5 的血压记录——这些都是"假装自洽闭合系统"的痕迹。

真实过程必然带着它生成过程的残渣,这就是为什么形式是过程的残余,而不是意图的投影。 一块真实雕塑的表面有刀痕、有应力裂、有材料的随机响应。一段真实研究的数据有失败、有反常、有解释不了的尾部。一个真实写作者的句子有跳跃、有冗余、有不完美的节奏感。

造假者无法忍受这些"不完整"——他们要把所有粗糙磨平,把所有抖动消除,把所有矛盾抹掉,提交一个看起来无懈可击的产物。

于是悖论出现了:越完美,越可疑。

这反过来对一切创作伦理是一次重新校准:在 89.4% 的造假时代,"去完整"不再只是一种美学选择,而成了一种真实性的统计学证据。 留下生成过程的残渣,留下未解决的矛盾,留下你判断力的痕迹——这些不完美变成了"这是真人做的"的指纹。

那些被 AI 大量生产的、过分流畅的、过分均匀的、过分自洽的文本和图像,反而在用它们的"完整"暴露自己的非人来源。完整曾经是品质的标志,现在是机器的标志。

下篇 · 建筑论文:一个比学术造假更荒诞的领域

讲到这里,需要把刀锋转向一个具体领域——一个我自己身处其中、看得最清楚的领域:建筑学论文。

如果说学术界整体的 89.4% 已经够荒诞,建筑学的情况更彻底——它不是"造假率高",而是"学术"这个概念在这个领域从未真正成立过。

第四节

建筑论文里没有"真"作为参照

学术造假至少还有一个"真"作为参照——你声称做了实验其实没做,前提是"做实验"这件事在该领域是有意义的、可验证的、可被复现的。

建筑论文不存在这个参照。

打开任何一本核心期刊——《建筑学报》《时代建筑》《新建筑》《世界建筑》——随便翻一篇所谓"学术论文",你会发现一个让人发冷的事实:

这些文本没有任何东西可以被证伪。

一篇讨论"地域性建筑表达的当代转译"的论文,它的论点是什么?它的证据是什么?它的方法是什么?它的结论可以被反驳吗?如果换一个人重新做这项"研究",能得到相反的结论吗?

没有。一篇都没有。

因为这些论文从一开始就没有要求过自己"可被证伪"。它们生产的不是知识,是学术形状的散文——是带着脚注的随笔,是穿着论文外衣的鉴赏文字,是把"我觉得"包装成"研究表明"的修辞游戏。

学术界造假至少还知道自己在造假——伪造的数据是知道自己应该真的。建筑论文不造假,因为它根本没有"应当为真"的基线。 你不能说一篇本来就不打算证明任何东西的文本"造假",它没有承诺过自己是真的。

这才是真正应该被点破的事:建筑论文不是"学术造假率高"的领域,而是"学术"这个概念在这个领域从未真正成立过的领域。

第五节

一篇典型建筑论文的解剖

让我们做一次解剖。一篇典型的建筑学核心期刊论文,结构是这样的:

第一节:引出一个时髦概念。可以是"在地性""日常性""诗意建造""批判性地域主义""新乡土""轻介入""微更新""针灸式改造"——这十年换一批,下一个十年再换一批。

第二节:援引一组西方理论家。海德格尔的"栖居",梅洛-庞蒂的"身体性",列斐伏尔的"空间生产",雅各布斯的"街道之眼",弗兰姆普敦的"建构文化"——这些名字以特定密度出现,构成一种"理论感"。

第三节:列举一组案例。卒姆托、王澍、张轲、华黎、董功——根据论文主题选择对应名单。每个案例配一段描述性文字,配几张图。

第四节:把第一节的时髦概念、第二节的西方理论、第三节的案例编织在一起,得出一个谁也无法反驳的结论——"建筑应当回应场所""空间承载着时间""建构是文化的表达"。

第五节:用一段稍微煽情的话结尾,呼应开头。

这就是建筑学论文的标准模板。 整个文本里没有一个假设,没有一组数据,没有一项可验证的论断,没有一条可以被同行重新检验的方法。

它不是研究报告,是文学评论。 而文学评论从来不接受"造假"的指控——因为它根本不在"真假"这个维度上运行。

但问题来了:文学评论不评职称、不分经费、不决定一个青年学者的生死。但建筑论文做这件事。

第六节

被假装成"学术"的鉴赏散文

建筑学最大的造假,不在哪一篇具体论文里,而在整个领域集体假装自己在做学术研究这件事本身。

把范围放到更宽:建筑历史的论文在做什么?大量是"重新发现某位被遗忘的建筑师"——这是档案整理工作,重要,但不是研究。建筑理论的论文在做什么?大量是"借用 X 哲学家的概念来谈论 Y 建筑现象"——这是阐释,是评论,不是研究。建筑设计的论文在做什么?大量是"我的项目体现了 Z 思想"——这是自述,是宣言,不是研究。

这些工作可以是有价值的——好的建筑评论比平庸的"研究论文"重要得多。问题不在这些工作本身,问题在于建筑学界把这些工作伪装成了"学术研究",并且用学术研究的评价标准去衡量它们。

于是出现一种奇观:一个写得极漂亮的建筑随笔——比如汉宝德、王澍早年的一些文字、童寯的园林笔记——按照当下的核心期刊标准是发表不了的。它太诚实了,它没有伪装成"研究"。 它直接说"我在评论""我在抒怀""我在记述",不假装自己有方法、有假设、有结论。

而一篇引用了海德格尔三次、援引了五个案例、有"研究方法""研究结论"小标题的平庸文本,却可以毫无障碍地发在 C 刊上。评价系统奖励的不是诚实的评论,是伪装成研究的评论。

这就是建筑学的造假——不是某些人造假,是整个领域被规训成必须用造假的形式提交真实的工作。

一个建筑学者哪怕真心想写一篇老实的鉴赏文字,他也必须把它伪装成"研究"才能发表。他必须加一个"研究方法"的章节(哪怕他根本没有方法),他必须列一组"研究问题"(哪怕他真正想说的不是问题而是感受),他必须给出"研究结论"(哪怕他真正的工作是开启而不是结论)。

于是诚实的写作者也成了造假者,因为系统不接受诚实形式的产品。

第七节

引用游戏:一种被精密设计的伪学术

建筑论文有一个特征极其鲜明的造假动作——引用游戏。

打开任何一篇当代建筑核心期刊论文,看它的参考文献。你会发现一种特定的引用结构:

必须引一个西方哲学家。 海德格尔最常用,因为"栖居"几乎可以套在任何关于建筑的讨论上。其次是梅洛-庞蒂、巴什拉、列斐伏尔,再次是德勒兹、福柯、本雅明。引用方式高度模式化——通常引一句话,不展开,不论证这句话和你论文主题的真实逻辑关系,只是让它"在场"。
必须引一个西方建筑理论家。 弗兰姆普敦、罗西、文丘里、柯林·罗、屈米——同样是一句两句,作为"理论支撑"出现,但和论文主体论证之间往往没有真正的因果关系。
必须引几篇中文核心期刊上的近期文章。 这是为了显示"对学术前沿的关注",但这些引用大多停留在"某某学者指出 X",然后下文并不真的回应或反驳"某某学者"。

这套引用结构在做什么?它在做装饰,不在做论证。

一个真实的引用应该是这样的——你的论证依赖某个前置结论,所以你引用那个结论的来源;或者你反驳某个观点,所以你必须先准确呈现它。引用是论证的承重结构,不是装饰条。

但建筑论文里的引用几乎全部是装饰条——它们可以被全部删除,论文的"论证"不会受任何影响,因为根本就没有"论证"。引用只是用来证明"作者读过书",而不是用来支撑某个具体推理。

这是一种比数据造假更狡猾的造假——它不伪造证据,它伪造"有证据"这个事实。 它通过引用的姿态制造"这是学术研究"的视觉印象,但拆开看,里面没有任何东西需要被这些引用支撑。

更糟的是:这套引用游戏是被建筑学博士培养体系明确教授的。 每一个建筑学博士生都知道自己的论文必须"看起来像论文",必须有正确密度的脚注、正确分布的引用、正确比例的西方理论家和中文学者。这是一种被制度化的造假训练。

第八节

博士论文:一个被工业化生产的"假装研究"

如果说期刊论文的造假还隐藏在"鉴赏伪装成研究"的层面,博士论文是这套造假机制最赤裸的呈现。

一个建筑学博士的真实工作流程是怎样的?

第一步:选一个题目。题目必须满足两个条件——足够宽泛到能写出 15 万字,足够时髦到能通过开题。"乡村振兴语境下的传统聚落空间更新策略研究""基于在地性的当代地域建筑创作方法研究""新文科背景下建筑遗产数字化保护与活化利用研究"——你立刻能识别出这种题目的语法。

第二步:搭框架。框架几乎是固定的——绪论、文献综述、理论基础、案例研究、策略提出、结论展望。每一章的内容在动笔之前就已经被框架决定了。

第三步:填内容。文献综述是从知网下载几十篇相关论文然后改写成"某某学者认为 X,某某学者指出 Y"。理论基础是把海德格尔、列斐伏尔等抄一遍。案例研究是把几个建成项目用统一格式描述一遍。策略提出是把前面三章的内容用"应当"句式重新组装——"应当注重场所性""应当尊重在地文脉""应当激活公共空间"。

第四步:补脚注。回头把所有"应当"句式找一个引用挂上去。

第五步:导师签字,盲审通过,答辩通过。

这是一条工业化生产线。 它生产的不是知识,是装订成册的、符合格式要求的、可以换取博士学位的纸质对象。

如果你问一个刚毕业的建筑学博士——你的论文提出了什么新东西?什么是你之前的领域不知道、因为你的工作之后才知道的?什么是你的论文如果被推翻,这个领域会真的损失什么?

绝大多数人答不上来。 不是因为他们不诚实,是因为这套生产线从一开始就不要求论文回答这个问题。论文不是知识贡献,论文是学位贡献。 它的功能是让一个人获得博士学位,而不是让人类知识增加一点。

这就是建筑学的 89.4%——不是 89.4% 的博士论文造假,是接近 100% 的博士论文不打算成为研究。 它们集体在扮演"研究"的形状,但没有任何一篇真的承担研究的功能。

第九节

设计类博士:把"未建成方案"塞进论文的奇观

更荒诞的是建筑学里的"设计类博士"——那种以设计实践作为博士论文核心的学位。

这本身可以是一种正当的学术形式——只要它诚实地说:"我用设计实践来回应这个问题,设计本身就是我的论证。" 这种"以设计为研究"(Research by Design)在欧洲学术界有一套相对成熟的方法论。

但中国建筑学的设计类博士,生产的是一种独特的造假形式——把未建成的方案包装成"研究成果"。

打开这类博士论文,你会看到一个标准结构:前半本是"理论部分"——海德格尔、地域性、批判性建造、若干西方建筑师案例分析;后半本是"实践部分"——一组学生时代积累的、从未建成的方案,配上效果图、平面图、轴测图,每个方案配一段"如何回应理论部分提出的问题"的解释文字。

问题来了:那些方案没有建成。它们没有经过结构验证,没有经过施工验证,没有经过使用验证,没有经过时间验证。 它们存在的全部证据,是图纸和渲染图。

而图纸和渲染图作为"证据",证明的是什么?证明这个方案被画出来了。仅此而已。

一个被画出来的方案不能证明它"回应了在地性"。一张渲染图不能证明这个空间"承载了诗意"。一组轴测图不能证明这个设计"激活了场所记忆"。这些论断都是作者强加在图像上的——读者只能选择相信或不相信,但无法从图像本身验证。

这是一种把信念伪装成研究结论的造假。 它比数据造假更彻底,因为它根本不在"数据"的层面上运行——它把整个论证建立在"作者的自述"和"读者的相信"之上,然后假装这是研究。

更深一层:这种博士论文得以成立的前提,是整个建筑学界默认接受"图像即论证"。 你画了,所以你证明了。你画得好看,所以你证明得好。你画的方案被发表了,所以你的研究被认可了。

这是建筑学界自己设的局——把图像生产工业和学术认证体系深度绑定,然后所有人都成了这个局的同谋。

终篇 · 还有什么是不造假的

第十节

剩余真实的所在

写到这里,那个真正的问题终于可以浮上来:

还有什么是不造假的吗?

这个问题如果用学术系统内部的标准回答,答案是冷的——剩下的 10.6% 大概率也不全是真的,只是还没被算法扫描到。那些在评奖、引用、晋升网络里循环的"正常论文",多数是更隐蔽的造假,是没有触发统计学警报的、更高明的伪装。

但这个问题如果换一个角度问,会得到另一个答案。

真正不造假的,是那些被造假成本筛选出来的东西。

什么意思?造假是有成本的——伪造数据需要时间、需要技术、需要风险评估。一个东西如果造假的收益小于成本,它就会自然保留真实。

那些不能带来职称、不能换经费、不能写进 KPI 的工作,往往是真的。
那些没有评审、没有奖项、没有等级评定的创作,往往是真的。
那些做了也不会被看见、被看见也不会被奖励的探索,往往是真的。
那些在体制外、在边缘、在没人注意的角落里持续发生的实践,往往是真的。

真实在 89.4% 的造假率下没有消失,它只是退场了——退到没有奖励机制的地方,退到造假者懒得去伪造的地方,退到系统的雷达照不到的地方。

一个在自己工作室里用算法做雕塑的人,没人评审他的种子数;一个在自己博客里写哲学札记的人,没人统计他的引用指数;一个在自己的代码仓库里持续开发工具生态的人,没人给他发"杰出贡献奖"。正是因为这些事情没有奖励,所以它们不值得造假;正是因为不值得造假,所以它们是真的。

回到建筑论文。建筑学剩余的真实在哪里?

它在那些不打算装成研究的诚实文本里——童寯写园林的笔记,是真的;汉宝德谈建筑的散文,是真的;齐康记述设计过程的随笔,是真的。这些文本之所以是真的,是因为它们没有伪装成研究。
它在那些真正具备研究形式的少数工作里——结构工程师对某种构造做法的实验报告,建筑物理学者对某种围护系统的实测数据,遗产保护研究者对某个老建筑做的逐层考古记录。这些工作有假设、有方法、有数据、有可被反驳的结论。它们是真的,因为它们承担了"可被证伪"这个义务。
它在那些记录设计真实过程而不是包装设计成果的文本里——一个建筑师诚实地写"这个方案我尝试了七版,前六版失败的原因是 X、Y、Z,最后这一版也只是相对不那么糟糕"——这种文本如果存在,是真的,但它发表不了核心期刊,因为它没有"研究结论"。
它在那些承认自己是评论、是阐释、是个人判断的文本里——一个建筑师说"我喜欢卒姆托这个项目,因为它的材料处理让我想起 X",这是诚实的鉴赏;同一个建筑师说"卒姆托的项目通过材料表达了在地性的本质",这是伪装成研究的鉴赏。前者是真的,后者是假的——尽管后者更容易发表。

这是这个时代最反讽的真理:真实从公共认证体系里撤退了,躲进了那些"没意义、没回报、没人看"的角落。 你想找真的东西,不要去看那些被授予最高荣誉的,要去看那些被认为"没有价值"的。

十一

当 89.4% 成为常态,谁还在做那 10.6%

在一个 89.4% 都是造假的系统里,做那 10.6% 的人是什么人?

不是道德更高尚的人。道德解释不了这件事——前面已经说过,诚实在这个系统里是会被淘汰的,所以剩下的诚实者不可能是被系统选择出来的。

剩下的真实者,本质上是不再以这个系统为存活前提的人。是已经从这个游戏里部分或完全退出的人。是不靠它的奖励活、也不怕它的惩罚的人。是把自己的判断、自己的工作、自己的探索安放在系统之外的人。

他们不是更勇敢,他们只是不再需要造假。

当造假率达到 89.4%,最后剩下的不是道德的胜利,是结构的旁路。是一群人通过把自己的生存基础迁出系统,从而获得了不参与游戏的资格。

回到建筑学这个具体的领域,这意味着一件让所有体制内建筑学者都不愿意听的事:

建筑学想要找回真实,不是改革论文制度,是让建筑学从"论文生产学科"重新变回"建造判断领域"。

让那些真正想做研究的人——结构、材料、物理、史学、保护——去做研究,按研究的标准要求自己。让那些想做设计的人——绝大多数建筑学者——去做设计,按设计的标准要求自己,不再需要把设计伪装成论文。 让那些想做评论的人——也很多——去做评论,按评论的标准要求自己,不再需要把评论伪装成研究。

让每一种工作回到它本来的形状。 这就是建筑学领域的"剩余真实"——在所有伪装被剥掉之后,剩下的那些可以承担真实标准的工作。

剩下多少?也许就 10.6%。也许更少。

但真实从来不是按数量取胜的——它是按"可被验证"取胜的,是按"经得起时间"取胜的,是按"不需要伪装"取胜的。

十二

结语

89.4% 不是一个数字,是一面镜子。

它照出的不只是学术系统的崩塌,是所有依附于这个系统的人不得不付出的代价。它逼着每一个还在意"真实"二字的人回答一个问题:

你愿意付出什么代价,来不站在那 89.4% 这一边?

对一个建筑学者来说,这个问题更具体:

你愿不愿意停止把鉴赏伪装成研究?
你愿不愿意承认你的设计是判断不是论证?
你愿不愿意写"我尝试了七版前六版失败"而不是"研究表明"?
你愿不愿意让你的工作建立在不需要 C 刊认证就能成立的基础上?
你愿不愿意让你的判断、你的建造、你的工具、你的写作,在体系之外找到它们的位置?

只有当一个人不需要这个系统给他发证、发奖、发钱、发认可时,他才能不造假。只有当一项工作不在这个系统的奖励路径上时,它才能保持真实。只有当一种判断不依附于这个系统的话语权时,它才能成为判断。

真实从公共认证体系里撤退了。

它退到了那些没人发奖的角落里,退到了那些不打算伪装成研究的诚实文本里,退到了那些必须把房子真的建起来的工地里,退到了那些用种子数和参数就能完整复现的生成过程里,退到了那些自己开发工具、自己写札记、自己做雕塑、不需要任何系统盖章就能存在的工作里。

剩余的真实不多,但够用。

够一个还在意"真实"二字的人,把自己的工作安放下来。

够一个不愿意成为那 89.4% 的人,找到自己站立的位置。