骗你一辈子的统计语言 The Statistical Language That Lies to You for a Lifetime
你不是集合 You Are Not the Set
我们的教育、我们的经济学、我们的统计训练、我们的新闻、我们的健康建议、我们的政策制定——几乎全部建立在"一群人的平均数值"上,然后被用来指导你这仅有一次的人生。
医生、理财顾问、保险公司、经济学家、政策制定者、建筑师、招生办、CEO、教育公众号、工程师、城市规划师、新闻联播——他们手里都有一张分布图,你站在分布上的某一格,但你看不见自己站在哪一格,你只看见那条平滑的曲线和那个安慰人的数字。
这篇文章想把这件事讲清楚:那条曲线、那个数字、那个分布,都不是你。你是一个站在单向时间里具体的人。
第一部分:集合不是你
平均数不会替你扛事
医生告诉你:"这个手术成功率 90% 以上。"听起来很安心。
但 90% 是医院去年做过的所有病人加起来的成功率,你不是那群病人,你是躺在手术台上的这一个。你要么醒过来,要么醒不过来,没有"90% 醒过来"这种状态。那 90% 里的人和那 10% 里的人,在统计表上是同一行数字,在现实里是完全不同的两种结局。手术室的门一关,统计学就留在门外了。门里只剩你一个人。
理财顾问告诉你:"股市长期年化 7 个点,你只要拿得住。"听起来很合理。但"长期"是谁的长期?是过去 100 年所有股民加起来的长期。你的长期到你 65 岁退休为止。如果你 58 岁那年正好赶上一次大崩盘,把养老金砍掉一半,你已经没有时间等它涨回来了——那张图上后面那条漂亮的上扬曲线,是给你儿子那代人画的,不是给你的。
保险公司告诉你:"这个年纪得这种病的概率只有 3%,没必要保这一项。"听起来很科学,你把这一项从合同里划掉。但 3% 是说 100 个同龄人里有 3 个会得,你不是 100 个人。你要么是那 97 个里的,要么是那 3 个里的,没有"3% 地得病"这种事。等你某天真的成了那 3% 中的一个,你翻出当年的合同,发现这一项正好没保。而保险公司用同一个 3%,在另一份合同里又告诉你"概率高达 3%,你必须加保"。同一个数字,他用来少赔,也用来多收。你不管选哪一边,都正好是他要的那一边。
每一句话都是用一群人的平均,回答你这一个人的具体命运。每一句话都在悄悄地把你当成可以替换的样本点——好像分布的另一端有另一个你,会替这个倒霉的你扛下后果。
但没有。从来没有。
人群是不存在的统计幽灵
你 50 岁查出癌症的时候,医生告诉你"这种癌症 5 年生存率有 60%"。这个数字不会让你身体里的肿瘤变小一毫米。
你公司倒闭的时候,经济学家在电视上说"长期来看经济总会复苏",这句话不会让你下个月的房贷有着落。
你父亲在抢救室里的时候,医院的墙上挂着"心肌梗死救治成功率逐年上升"的横幅,这个上升不会让他多睁开一次眼睛。
人群是别人。人群是不存在的统计幽灵,是论文里的一个数字,是新闻标题里的一个百分比,是政策 PPT 上的一根曲线。
而你是这个——正在读这行字的、有具体身体的、不能被替换的、从生到死走一条线的存在。
把这两个混为一谈,是一切错误决策的源头。
你以为的理性,其实是别人的算法
你把房子首付款借给开餐厅的朋友,觉得"餐饮回本快,平均两三年就能回来"。
平均两三年回本的是开过餐厅的所有人加起来的平均——里面有半年回本的网红店、有三年慢慢回本的老店、也有第二年就关门血本无归的。把这三种命运加起来取平均,得到"两三年"。
你借出去的不是这三种命运的平均,是你这一笔钱。它的真实结局只有一个,而那个结局不在"平均"里——它在某一家具体的店里:这家店开成了你按时拿回,这家店半死不活你只能拿回一部分,这家店彻底关门,你很可能一分钱都拿不回来。"平均两三年回本"不是建议,是统计学幻觉。它把分布的方差全部熨平,然后递给你一根看起来可以接受的曲线。你照着这根曲线规划自己,然后在某个具体的下午接到那个朋友的电话——他说"店实在撑不下去了"。
你连续 3 年加班到凌晨两点,体检报告每年都说"指标在正常范围内,注意休息"。指标正常的是把你和一万个加班的人放在一起的平均,你身体里的损耗是你一个人在累积。某天你在地铁站突然倒下的时候,那一万个人不会有一个来分担,他们各有各的命运,各自在自己的时间线上独自垮掉。
你看到新闻说"创业公司平均融资到 B 轮的有 30%,做到上市的也有 5%",你拿出全部积蓄去创业。30% 和 5% 是风投手里那一堆项目的平均。风投有 20 个项目,赔 19 个赚 1 个,他依然是赢家。你手里只有一个项目,就是你自己,赔了就是赔了。没有"另外 19 个"在分布另一端补偿,你不在那个分布里,你就是那个分布里的一个点。风投在用一群人的平均思考,因为他真的有一堆项目。你不能,因为你只有你自己。但你被训练得跟他用同一套语言、同一套模型,仿佛你们在玩同一个游戏。你不是。你从来不是。你们看的根本不是同一件事——他在看一张概率分布图,你在看一面镜子。
建筑:一个用平均语言写成的行业
讲到这里要把建筑专门拎出来,因为建筑是这种思维错位最深、最系统、也最不易察觉的领域。它把人群的平均砌成了你每天要住进去的房子。
你买的那套房,售楼处说"日照符合规范,大寒日满窗两小时"。
规范是把全国所有住宅、所有朝向、所有家庭加起来算出来的统计下限——而且是经过几十年下调之后的下限(早年要求冬至日一小时,因为大多数城市达不到,后来才改成大寒日两小时这种更宽松的标准)。你不是那条规范,你是站在你家飘窗前的那个具体的人。你那扇窗有没有被前楼挡住、被斜对面的塔楼削掉一角、被自家阳台外飘的板挡住一截——这些都不在规范的计算范围里。规范算的是"主要居室在大寒日中午这段有效时间内能不能凑够两小时",凑够了就合规。它不管你常住的那间次卧朝东、不管你的工作时间正好错过大寒日中午那两小时、不管你冬天的下午是从两点半开始一寸一寸丢失阳光的。规范说你"合规",你冬天午后那种沉甸甸的抑郁是你自己的,不是规范的。
你买的那套"三房两厅",户型图上画着一个标准的三口之家加偶尔过夜的老人。
这个家庭是开发商和建筑师从市场调研报告里平均出来的,从来没有真实存在过。住进去的是你这一家——你是独居的中年人,是丁克,是要照顾失能父亲的独生女,是离婚后带两个孩子的母亲。那个画在图纸上的"使用者"只是统计幽灵,而你每天要在为这幽灵设计的空间里,过你这具体的一天:你父亲的轮椅卡在那条标准走廊的转角,你两个孩子争抢那个只够一个人用的"次卧",你独居的夜晚被一个为了"团聚"设计的客厅放大成一种廉价的空旷。设计师在画图时调用的是平均,你住进去之后消耗的是真实的生活。"人均居住面积达到小康标准"是把十四亿人加起来除出来的数字。你家三代五口挤在 90 平米里的那种窒息,这个"达标"不会替你多隔出一间房。
你 22 岁选建筑学的时候,招生宣传说"行业平均收入逐年上升""注册建筑师缺口大""设计院待遇稳定"。
平均收入上升的是把明星事务所合伙人和县城施工图描图员加在一起的平均。缺口是行业整体的缺口。稳定是设计院作为机构的稳定。你不是行业,你不是机构。你是 35 岁那年被裁、房贷还有 20 年、手上除了画图没有任何可迁移技能的那个具体的人。行业可以"周期性调整",行业可以"转型升级",行业可以"长期向好"——行业有无数个项目,赔一批还有下一批。你只有你这一次职业生涯,赔了就是赔了。
最讽刺的是,整个建筑学的训练,从一年级到五年级,都在教你用人群的语言思考——用户、使用者、人流、密度、规范、指标。你被训练得太熟练,以至于轮到你自己的人生时,你还在下意识地用"行业平均"安慰自己。
你画了一辈子别人的空间,却从来没人教你看清自己站在分布的哪一格。
第二部分:骗你一辈子的统计语言
你不是集合——这是哲学。但你这一辈子真正被骗的,是十几种具体的统计句式。
它们不在论文里,在售楼处、招生办、体检报告、基金宣传册、相亲介绍、保险合同、年终总结、新闻头条里。它们用的是同一套语法、同一套修辞、同一套貌似科学的外衣。它们不是要骗你的钱——骗钱是小事。它们要骗的是你对自己人生的判断力。等你五十岁某个具体的下午突然回过味来的时候,钱可以再赚,判断力赔进去的那二十年回不来了。
我把这些最常见的统计骗术列出来,每一种都长得像真理,每一种都在你人生的某个关口等着你。
就业率 95%
招生办的展板上写着"我校毕业生就业率 95% 以上"。
这个 95% 里包括:签了三方协议的、读研的、出国的、考公备考的、回老家"灵活就业"的、家里开公司挂个名的、在咖啡馆做兼职的、送外卖的、以及辅导员打电话求你随便填一个的。
它把进投行的和送外卖的算在同一行,把年薪百万的和月薪三千的算在同一行,把热爱本专业的和被专业坑了十年的算在同一行。
然后这个数字被印在招生简章上,你 18 岁那年看着它做了选专业的决定。
你不是 95%。你是四年后那个具体的人,坐在出租屋里投第 200 份简历,看着手机里那条"已读未回",怀疑自己是不是哪里出了问题。
没有出问题。是那个 95% 从一开始就不是说给你听的。它是说给招生指标听的,说给教育部排名听的,说给学校的 PPT 听的。轮到你的时候,它转身就走了。
平均工资
统计局每年公布"城镇就业人员平均工资 X 万"。每次公布完,评论区都是"我又拖后腿了"。
不是你拖后腿,是这个平均数本身就是一个数学幻觉。
把马云和你一起算平均,你年薪百万。把一栋楼里的董事长和保洁阿姨平均,这栋楼人均中产。平均数对极端值毫无抵抗力,而真实社会的财富分布,本来就是极端值堆出来的。
真正能反映普通人的是"中位数",但中位数从来不上头条,因为中位数太难看。
你看着平均工资焦虑,以为自己在跟"大多数人"比,其实你在跟一个由几个超级富豪拉高的统计幽灵比。那个幽灵每年都比你过得好,而它根本不存在。
你拖的不是后腿。你拖的是一个被精心设计成让你永远拖后腿的数字。
长期年化 7%
理财顾问翻开那本印刷精美的宣传册,指给你看那条上扬的曲线:"标普 500 长期年化 7%,你只要拿得住。"
这条曲线起点在 1926 年。
你想一想,1926 年到现在,中间发生了什么。大萧条、二战、滞胀、互联网泡沫、次贷危机、新冠崩盘。把这一百年所有的崩溃和复苏拉平,得到一条漂亮的 7%。
你没有一百年。你从 30 岁开始攒钱,到 60 岁退休,你只有 30 年。如果你 58 岁那年正好撞上一次腰斩,你已经没有时间等它涨回来——曲线后面那段优美的复苏,是给下一代人画的。
更阴险的是:从哪一年算起,得出的"长期年化"完全不同。从 2009 年算到 2021 年,年化 15%;从 2000 年算到 2012 年,年化接近零。宣传册总是恰好挑那段最漂亮的窗口,告诉你"长期看一定赚"。
你买的不是基金,是别人精心挑选的一段时间窗口。窗口外面的那些黑暗年份,他不让你看见。
5 年生存率
医生看着报告对你说:"这种癌症 5 年生存率 60%,不用太悲观。"
你回家上网查,所有的科普文章都告诉你 60% 是个好数字。你睡了几个不太安稳的觉,开始安排治疗。
但 60% 是一个分布。它把早期发现的、晚期发现的、年轻的、年老的、基础病多的、基础病少的、富的、穷的、心态好的、抑郁的——全部加在一起,平均出来一个数。
你不是 60%。你是某一个具体的格子里的人:你的分期、你的位置、你的基因型、你的身体底子、你能不能买得起进口药、你家人能不能照顾你。这些因素决定了你真实的概率,而那个真实的概率从来没出现在那篇科普文章里。
最残忍的是这个数字的结构:它不会让你身上的肿瘤变小,但它会让你心理上接受一种虚假的安全感,然后用这种安全感推迟某些本该立刻做的决定。
5 年生存率不是给你的,是给医院的论文用的,是给医保的定价用的,是给药厂的宣传用的。轮到你,你要么活过 5 年,要么没活过。中间没有"60% 地活着"这种状态。
住学区房的孩子学习好
教育公众号反复推送一类文章:"学区房片区的孩子成绩更好""重点小学对口学区的升学率更高""住名校隔壁的孩子情商也高"。
每一条都是真的,每一条都骗了你。
相关性不是因果性。买得起这个片区学区房的家庭,父母大概率是高学历、高收入、强人脉、强自律——这些东西本身就让孩子学习好。学区房只是这些东西的一个外显标签,不是原因。
更阴险的是:学区房不是完全没用。它真的给你一些东西——孩子的同学是同一类家庭的孩子,孩子的老师是被这个片区平均水平筛过的老师,孩子的成长环境是一个被高学历家长共同维护的小生态。所以你不能说它一点用没有,你也不能说它兑现了它的标价。
它给你的是一份"环境效应",大概值你付出的十分之一。剩下的十分之九,你买的是那个集合的标签——你以为只要进入这个集合,你就能继承这个集合里所有家庭的属性。
继承不了。你的高学历父母不会跟着房产证一起过户,你没读过的书不会因为隔壁邻居读过就出现在你脑子里,你二十年没培养的自律不会因为对口学校的旗杆比别人家高就长出来。
但这一切的根源,比你想的更深一层。
学区房这套系统不是教育需求自然演化出来的,是被制度性地建造出来的。
教育资源本来是公共品,本来应该靠税收均衡分配。但当地方财政严重依赖卖地的时候,教育就被人为绑定到房产上——好学校只对口某些小区,某些小区只能从开发商那里买,开发商的地是从地方政府那里拍的。每一寸"学区"溢价,本质上都是地方政府提前向你子孙后代抵押的财政。
你交的学区房溢价不是教育费,是土地财政的长期国债。你以为你在给孩子买未来,你其实是在用孩子的未来给一个早就该改革的财政体系续命。
更精妙的是这套系统的自我闭环:政府划学区——开发商高价拿地——房子卖出学区溢价——地方政府收到土地出让金——再用这笔钱去做"教育均衡化"的政绩工程——然后再划下一片学区。每一轮你都在为同一个东西付两次钱:一次以房贷的形式,一次以税收的形式。
你不是在跟"教育资源稀缺"博弈。你是在跟一个被设计成永远稀缺的系统博弈。在这个系统里,稀缺不是 bug,稀缺是 feature——不稀缺,土地就卖不出价。
二十年后,孩子没考上预期的学校,你坐在那套掏空了三代积蓄、月供压垮整个家庭十几年的房子里想不通:别人家的孩子怎么就行?
不是别人家的孩子行。是你买的那个"行"从一开始就是别人的属性,不是房子的属性。你买到了房子,你以为你也买到了房子背后那个集合——但你不在那个集合里,你只是站在那个集合旁边。
更难堪的是:那个把你拉到集合旁边的人,根本不在乎你能不能进集合。他在乎的是你愿意为站在集合旁边付多少钱。
教育公众号不会告诉你这个,因为它的广告主就是中介。中介更不会告诉你,因为这是他全部生意的根基。地方政府最不会告诉你,因为这是它过去二十年财政模型的核心假设。
私立学校升学率 80%
私立学校的招生简章上印着:"我校近三年重点大学升学率 80%。"
你以为这是教育质量的证明。其实这只是筛选的证明。
第一,生源是筛过的。要笔试要面试要家庭背景,差生进不来。 第二,中途差的学生会被"建议转学",分母悄悄变小。 第三,出国的、读专科的、复读的,都按学校自己的口径算"升学"。 第四,只统计参加高考的那部分人,不参加的不进分母。
经过这四层筛选和分母调整,80% 是一个被精心构造出来的数字。它衡量的不是学校教得多好,而是学校筛得多狠、统计口径多宽。
你交了一年二十万学费,把孩子送进去,以为孩子站到了一条 80% 的轨道上。其实你只是把孩子塞进了一个筛选游戏里——他要么是那 80% 里被筛留下的,要么是那 20% 里被劝退的,中间没有学校承诺的"教育增量"。
如果他自己本来就在那 80% 的料,这二十万学费的本质是给学校的统计数字买了一个保险。如果他不在,二十万会变成劝退电话里那句"我们觉得贵子弟可能更适合别的学校"。
离婚率 40%
新闻反复说"中国离婚率已达 40%"。
这个数字是当年的离婚数除以当年的结婚数。但这两个数根本不是同一批人——分子是结婚多年的存量,分母是当年新结的流量。一个分布的存量除以另一个分布的流量,得出来的数毫无统计意义。
真正的"结过婚的人最终离婚的概率"需要追踪同一批人几十年,这种数据极少有人做,做出来的结果跟 40% 差很远。
但 40% 已经成了一种社会氛围。它让没结婚的人犹豫,让结了婚的人警惕,让吵架的夫妻觉得"反正大家都这样",让相亲市场的人提前防御。
你做的人生最重大的决定之一——结婚或不结婚、生孩子或不生、信任伴侣或不信任——可能被一个算法上根本不成立的数字默默地影响了十几年。
数字不需要正确就能改变你的命运。它只需要被反复说,就够了。
年化波动率 15%
基金经理给你看一份报告:"我们的产品年化波动率 15%,属于中等风险。"
15% 听起来像是一个温和的数字,你想象的是收益偶尔上下波动一点。
但波动率是一个关于时间被压平的概念。15% 的年化波动率,在十年的时间窗口里,几乎注定会经历一次 30% 以上的回撤,有相当概率经历一次 50% 的腰斩。
更要命的是,腰斩不是平均地发生在你 30 岁、40 岁、50 岁。它倾向于在你最不能承受的时候发生——经济差的时候你公司也在裁员,房贷压力最大的时候市场也在下跌,你父母最需要钱治病的时候你的账户也在缩水。
风险不是均匀分布的,它是相关的。所有坏事倾向于一起发生。这一点宣传册不会告诉你。
15% 不是"温和波动",15% 是"在你这辈子的某个具体的下午,你会眼睁睁看着账户缩掉一半,而那个下午大概率也是你工作不稳、家人生病、孩子要交学费的下午"。
百年不遇的灾难
新闻里反复出现一个词:"百年不遇"。
百年不遇的洪水、百年不遇的高温、百年不遇的金融危机、百年不遇的疫情、百年不遇的地震、百年不遇的暴雪、百年不遇的山火。
你年年都看到"百年不遇",年年都觉得"运气真背"。
但你想一想:如果一件事每年都发生,它怎么可能是"百年不遇"?
答案是:"百年不遇"是一个用过去 100 年的数据算出来的频率,而过去 100 年和未来 100 年根本不是同一个系统。气候变了,城市建起来了,人口密度变了,金融杠杆变了,全球化把一切都连在一起了——百年一遇的尺子是按一个已经不存在的世界刻的,你却拿它来量你现在脚下这个世界。
更阴险的是这个词的心理结构。它让你以为这种事很稀有,所以你不准备、不投保、不撤退、不留余地。它给你一种虚假的安全感,而那种安全感正是你最后被一巴掌打趴下的原因。
工程师用"百年一遇"算防洪堤的高度,然后这条堤五年里被淹了三次。城市规划师用"百年一遇"算排水管直径,然后每年夏天都看到地铁站灌水。金融监管者用"百年一遇"算尾部风险,2008 年发生了三次"六西格玛事件",2020 年又一次,2023 年又一次。
真相是:这个世界的尾部比模型厚得多。极端事件不是偶尔来一下的访客,它是系统结构里随时会爆发的一部分。你把它当稀客,你就为它准备得不够;你为它准备得不够,你就在它来的时候付全部代价。
而且——这是这个骗术最致命的地方——"百年不遇"是一个面向集合的频率,不是一个面向个体的频率。它说的是这种事每 100 年大约发生一次,不是说你这辈子只会赶上一次。
你 25 岁那年赶上一次金融危机,35 岁那年赶上一次疫情,45 岁那年赶上一次气候极端事件,55 岁那年赶上一次系统性资产价格崩塌——每一次都是"百年不遇",每一次合起来正好覆盖你的一辈子。
百年不遇的灾难,对集合来说是稀客,对你的人生来说是常客。
你这辈子大概率会经历三到五次"百年不遇"。把它当稀客,你就准备一次的余粮;把它当常客,你就准备五次的余粮。这两种准备方式的差距,决定了你在第三次的时候是站着还是躺着。
平均寿命 78 岁
新闻里说"中国人均预期寿命已达 78 岁"。
你父亲 62 岁,你听到这个数字,默默算出"还有 16 年"。你觉得有时间。
但 78 岁这个数字是把婴儿死亡率、儿童夭折率、青壮年意外死亡率全部算进去之后得到的一个平均。它的含义是"一个刚出生的婴儿期望能活多久",不是"你父亲还能活多久"。
一个已经活过 62 年的人的剩余寿命,是另一张完全不同的表——而这张表里还要再扣除你父亲具体的基础病、他抽了四十年的烟、他高血压十几年没好好控制、他从来不体检的那些年。
你以为还有 16 年,所以你今年的春节没回家,你计划"明年再说"。
平均寿命里那个 78 岁的人,不在你家。你家里那个具体的人,有他自己的那张表,而那张表你没看过。
等到某个具体的电话打来的下午,你才意识到:78 这个数字从来没有进过你家的门。它在新闻里,在统计公报里,在养老金精算师的电脑里——就是不在你父亲的身体里。
经济稳中向好
打开新闻联播,你听到的是"经济运行总体平稳、稳中有进、稳中向好"。打开宏观研报,你看到的是"基本面稳健,长期向好趋势不变"。打开年度政府工作报告,你读到的是"成绩来之不易、形势依然复杂、信心不能动摇"。
你听了十年。
但你这十年发生了什么?
你工资两年没涨。你公司去年裁了一半。你那笔三年前买的基金还在水下。你父母的退休金涨幅追不上他们医院账单的涨幅。你的房子从挂牌一年降了三次价才卖掉。你身边五个朋友里有两个在考公,一个在送外卖,一个在做小红书,只有一个还在原来的行业里挣扎。
"稳中向好"和你这十年,显然不是一回事。
那是怎么回事?
"稳中向好"是一个宏观聚合指标的描述:GDP 没掉下来、CPI 在区间内、就业率达标、出口尚可。这些数字加在一起的总和没崩,所以叫稳;比上一个季度略微动一动,所以叫向好。
但聚合指标的"没崩",是无数个个体的破碎被平均出来的"没崩"。
你那一行的失业、你那个城市的房价、你那个年龄段的焦虑、你那个收入区间的痛感——在聚合层面全部被对冲掉了。某个行业崩了,另一个行业起来了,合起来还是"稳"。某个年龄段惨了,另一个年龄段好了,合起来还是"向好"。
这个语言不是骗你,它在它自己的尺度上是真的。它骗你的方式是:它让你以为这个尺度也适用于你。
它不适用。
宏观的"稳"是统计的稳,你的"稳"是房贷能不能按月还上的稳。宏观的"向好"是季度环比的向好,你的"向好"是孩子明年补习班的钱有没有着落的向好。这两种稳是不同语种的稳,翻译不过来。
更精妙的是:"稳中向好"这套语言一旦内化,它会让你怀疑自己的痛感。
你明明日子在变难,但新闻告诉你大盘稳中向好,于是你开始想:是不是我自己出了问题?是不是我能力不够?是不是我不够努力?是不是别人都在向好只有我在掉队?
不是。是你用错了语言来描述你的处境。
宏观叙事像一个很大的被子,盖在一万张床上。被子的平均温度是温暖的——但盖在你这张床上的那个角,可能正好在窗边,正好漏风,正好你身上的那条腿在外面冻着。被子整体温暖不会让你那条腿不冷,新闻里的温暖不会让你的具体的下午不焦虑。
你听到"稳中向好"的时候要问的不是"是不是真的稳",而是:这个稳,是哪一层的稳。我在那一层吗。
大多数时候,你不在。
用户增长 300%
公司年会上,CEO 在 PPT 上指着一根陡峭的曲线:"我们今年用户增长 300%,营收增长 200%,行业第一。"
掌声雷鸣。你也在台下鼓掌。
但 300% 没有告诉你基数。从 100 涨到 400 是 300%,从 100 万涨到 400 万也是 300%——一个是地摊水平的增长,一个是行业巨变。增长率脱离了基数,什么都不是。
更深一层:百分比是给增长讲故事的语言,绝对数是给现实结账的语言。CEO 用百分比,因为百分比永远比绝对数好看。当公司还小的时候,他用增长率;当增长率不好看的时候,他换成总用户数;当总用户数不好看的时候,他换成"日活";当日活不好看的时候,他换成"用户停留时长"。
每一个指标都是真的,每一个指标都在掩盖另一个指标的真。
你被这套语言训练了十几年。你看新闻、看财报、看公司汇报、看自己的年度总结——你都学会了挑那个最好看的指标讲故事。久而久之,你失去了一种能力:用绝对数、用真实状态、用未经修饰的现实评估自己的人生。
你年底坐下来写总结,你说"今年读了 30 本书,比去年多 50%"。你不说那 30 本书有 20 本是翻了五页就放下的,你不说去年的基数其实是 20 本里有 15 本读完了。
你也在骗自己。你用的是同一套语言。
国家大事与月薪 3000 元的我
打开手机,头条是:GDP 增速 5.2%、CPI 同比 0.3%、外贸顺差再创新高、人均可支配收入增长 6.1%、十大经济新引擎、产业升级新格局、新质生产力突破、双循环战略成效显著。
你看完,转身去煮一包泡面,因为下个月的房租还差八百块。
这不是讽刺,这是一种结构性的脱节——而这种脱节本身,就是这一整套统计语言的政治功能。
这不是副作用,这就是产品本身。
GDP 是把全国所有生产价值加在一起的总和,它的增长跟你的工资有没有涨没有直接关系。马云一年增加的资产可以拉高一个省的人均 GDP,而你那一年可能在工资倒挂。人均可支配收入 6.1% 的增长,是把所有人加在一起平均出来的,在这个平均里,前 10% 的增长可以是 20%,而你这一格可以是 -5%——合起来还是 6.1%。
外贸顺差再创新高,跟你月薪 3000 没有关系。新质生产力突破,跟你月薪 3000 没有关系。十大经济新引擎,跟你月薪 3000 没有关系。
但这套语言被设计成让你觉得有关系。
它告诉你:国家好了,你就好了。国家强了,你就强了。国家在长,你也在长。它把宏观和微观、集合和个体、整体和个人,用一套修辞焊接在一起,让你分不清哪一部分是国家的,哪一部分是你的。
于是当你日子不好过的时候,你看着新闻里那些蒸蒸日上的数字,会自动产生一种愧疚:国家都这么好了,我怎么还过不好?是不是我哪里没努力?
不是。是这两件事本来就不在同一个尺度上。
国家大事用的是聚合尺度,你的生活用的是个体尺度。这两个尺度之间没有自动的传导机制——传导需要分配,分配需要制度,制度需要博弈。"国家好"不会自动变成"你好",中间隔着一整套从未对你公开过的分配机制。
更精妙的是这套语言的双向勒索:
当宏观数据好的时候,它告诉你"你应该感到自豪,你应该满意"——如果你不满意,就是你不识好歹。
当宏观数据不好的时候,它告诉你"国家有难,你应该共度时艰"——如果你抱怨,就是你不顾大局。
你的赢面是零。数字好的时候你不能抱怨,数字不好的时候你必须忍耐。你的个体感受从来没有被这套语言承认过——它被吸收、被对冲、被平均、被解释、被压平,最后变成那张统计公报上一个看不见的小数点。
而你真实的处境呢?
你的月薪 3000 是一个绝对数,你的房租是一个绝对数,你父母的医药费是一个绝对数,你孩子的奶粉钱是一个绝对数,你的睡眠时间是一个绝对数。绝对数有重量,绝对数不能被对冲,绝对数不会因为另一个人活得很好而变好。
GDP 增长 5%,你的月薪还是 3000。 人均可支配收入涨 6.1%,你的月薪还是 3000。 新质生产力突破,你的月薪还是 3000。 双循环战略成效显著,你的月薪还是 3000。
你不在那个集合里。你从来没有在那个集合里。
但你每天被这个集合的语言灌溉——新闻、广告、领导讲话、年终总结、朋友圈刷屏的捷报——它让你以为你在这个集合里,以为你的命运和这个集合的命运同步,以为你只要再等一等、再忍一忍、再努力一点,你就能分享到那个集合的"向好"。
这是统计语言最深的政治功能:让你为一个不包含你的集合,贡献你的劳动、你的耐心、你的沉默。
那个集合不会回报你。它没有义务回报你。它根本不知道你存在。
国家大事和月薪 3000 元的你,从来不是一回事。
意识到这件事不是要让你愤世嫉俗,不是要让你放弃,也不是要让你跟谁对立。意识到这件事是要让你把自己的尺子还给自己——你的生活要用你的尺子量,不是用 GDP 的尺子量;你的成败要用你的指标算,不是用统计公报的指标算;你的幸福要用你具体的下午、你父母还在不在、你身体还撑不撑得住来定义,不是用"长期向好趋势不变"来定义。
把这把尺子拿回来,你才有可能过你自己的人生,而不是替一个不存在的"国民"过一辈子。
第三部分:谁有资格对你说话
不承担后果的人不值得听
读到这里,你已经看完十七种骗你一辈子的统计语言。但还有一个更上一层的问题:
所有这些数字背后,都有一个发声者。你怎么判断这个发声者值不值得听?
不是看他的履历、不是看他的头衔、不是看他的谈吐、不是看他的 PPT。
专家、大 V、网红、教授、顾问、分析师、KOL、CEO、官员——他们的履历、职务、头衔、优雅的谈吐和精美的 PPT,都是低成本的伪装。
真正能检验他们的标志只有一点:他们是否会为自己的判断承担真实后果。
如果不承担一丝一毫的后果,那就是一文不值的屁话。
回头看前面十七条骗局,你会发现一个共同的结构:
招生办告诉你"就业率 95%"——你毕业找不到工作的时候,招生办不承担任何后果。他的 KPI 是招满人,他完成了。
理财顾问告诉你"长期年化 7%"——你 58 岁腰斩的时候,他不承担任何后果。他的提成是按你买入金额算的,不是按你最终收益算的。
医生告诉你"5 年生存率 60%"——你成了那 40% 的时候,医生不承担任何后果。他做的是统计意义上正确的医学建议,这件事不会因为你的具体死亡而改变。
售楼处告诉你"日照合规"——你住进去抑郁的时候,售楼处早就把销售奖金兑现完了,卖你那套房的销售员可能已经离职了。
CEO 告诉你"用户增长 300%"——公司爆雷的时候,他套现的股票早就到账了。
教育公众号告诉你"学区房有用"——孩子没考上的时候,公众号已经赚完了广告费。
新闻联播告诉你"稳中向好"——你过不下去的时候,播音员不承担任何后果。
每一个发声者,都不站在自己话语的弹道线上。
他们说的话飞向你,击中你,改变你的人生。但他们从来不站在那条弹道上,所以子弹击中你的时候,他们毫发无损。
一个不承担后果的人,无论说什么都是屁话,因为它没有任何责任。
你的医生开的处方,他不需要服下去。 你的理财顾问推荐的产品,他没有买。 你的招生办鼓吹的专业,他的孩子不读。 你的房产中介推销的小区,他自己不住。 你的 CEO 描绘的未来,他已经在做财务自由的准备。
而你,服下了处方、买入了产品、报了那个专业、买了那套房、把青春押在了那家公司——你站在所有话语的终点,你是后果的唯一承担者。
这是判别一切建议的元标准,比任何统计学训练都重要:
没有后果的观点,是一文不值的屁话。 没有代价的信仰,是廉价的姿态。 没有牺牲的爱,是修辞。 没有风险的美德,是表演。
它们都长得像真东西。它们用着真东西的词汇、真东西的语法、真东西的情感强度——但它们的价值都是零,因为它们没有承担任何后果。
一个建议如果说错了,发声者也跟着倒霉,那这个建议你可以认真听。 一个建议如果说错了,发声者毫发无损,那这个建议你听的时候就要打一个折扣。 一个建议如果说错了,发声者反而更赚——你就要意识到这不是建议,是收割。
你这一生听过的大多数话,属于第三类。
招生办说错了,招生办更赚(招到更多孩子上不好的专业,完成指标拿奖金)。 理财顾问说错了,理财顾问更赚(你割肉再买入,产生新的手续费)。 新闻说错了,新闻更赚(你越焦虑,你越看新闻,广告费越高)。 学区房中介说错了,中介更赚(下一波家长还会来,每一轮都收一遍中介费)。
这不是骗局的副作用,这是骗局的结构本身——这套系统被设计成"说错话的人比说对话的人赚更多"。
那你怎么办?
你不可能查证每一句话。你能做的是:每次有人对你说什么的时候,在心里默默问一句——他的后果是什么?
如果他赌了自己的钱、自己的孩子、自己的健康、自己的名声、自己的下半生——他说的话有重量,可以认真听。
如果他赌的是你的钱、你的孩子、你的健康、你的名声、你的下半生——你听的时候要把每个字都当屁来过滤。
这是一辈子最重要的判别题。前面十七条统计骗局都是它的子题。
把这一题答对,你会发现你身边能听的话变得很少——但能听的那几句,会值千金。
第四部分:被训练用错误的方式生存
最深的损伤是认知
钱亏了可以再赚,但被训练用错误的方式思考生存,是一种更深的损伤——你甚至不知道自己被损伤了。
前面十七种骗局,每一种你都可能识破其中几种,但你识破不了你思考的语言本身。
因为你从小到大被教的就是这套语言:用平均数评估自己、用百分比规划人生、用宏观叙事消化痛感、用聚合指标定义成败。你做的"统计上最优"的选择,然后在某个具体的下午,具体地破产、具体地生病、具体地后悔——而所有的教科书都帮不了你,因为教科书写的不是关于你的。
教科书写的是那个从未存在过的"平均人",那个人活在所有书里,但不活在任何一间病房、任何一个工位、任何一个家。
最深的损伤不是某一次被骗,是你用骗你的那套语言来评估自己有没有被骗。你拿着尺子量尺子,得出的结论永远是这把尺子准确。
那应该怎么思考?
每一个问题都要做一次切换:从一群人的视角,切到你自己的视角;从别人的、不存在的人,切回你这条具体的命。
医生说"成功率 90%",你要问的不是"概率高不高",而是:那 10% 失败的人后来怎么样了。如果我成了那 10%,我和我家人扛得住吗。
理财顾问说"长期平均 7%",你要问的不是"回报够不够",而是:在那个长期到来之前,有没有可能一次大跌就让我提前出局。那种出局,是不是永久的。
新闻说"这种病早期发现 5 年生存率很高",你要问的不是"我应不应该乐观",而是:如果我是那个晚期才发现的,有没有什么是我现在就能做的。
售楼处说"日照、间距、人均面积全部合规",你要问的不是"达不达标",而是:我家里那个轮椅,我妈那种怕黑的失眠,我父亲走路要扶墙的那条路径,在这个户型里能不能生活下去。
招生办说"行业前景好",你要问的不是"行业怎么样",而是:如果十年后行业平均收入翻倍而我被裁掉,我还有什么。
CEO 说"用户增长 300%",你要问的不是"公司是不是行",而是:绝对数是多少,基数是什么,这个数字下次还能不能讲。
新闻说"百年不遇的灾难",你要问的不是"运气好不好",而是:如果它每十年来一次,我的房子、我的工作、我的积蓄、我的家庭,能扛得住几次。
新闻说"经济稳中向好",你要问的不是"是不是真的稳",而是:这个稳是哪一层的稳。我所在的那一层,是不是同一个方向。
新闻说"国家发展取得历史性成就",你要问的不是"我应不应该自豪",而是:这个成就的分配机制是什么。我在分配的哪一格里。
专家在电视上侃侃而谈,你要问的不是"他说得对不对",而是:如果他说错了,他会损失什么。如果他什么都不会损失,他说的就不是建议,是表演。
不是降低标准、不是放弃乐观、不是变得悲观主义——是把决策的尺度从"集合"调回"个体"。是承认你只有一次,所以你的所有判断都必须为这"只有一次"负责。
只有一次
你查出来的那个病就是你的病,统计数据不会替你扛。
你亏掉的那笔钱就是你的钱,概率不会还给你。
你过去那个不可挽回的决定就是你做的,平行宇宙里那个做了别的选择的"你"不会出现在这间屋子里。
你不能让那个赚了钱的版本来给你打钱,你不能让人群的长寿来填进你的寿命,你不能让分布的另一端来抵消你站着的这一端。
你必须用一种适合"只有一次"的思维,过这只有一次的人生。
结语
你不是集合。
集合可以平均,可以重复,可以替换。你不能。
你这一辈子能省下的最重要的东西,不是钱,是判断力。是那种到了五十岁某个具体的下午,你坐下来回顾一生,不会突然意识到自己一直在替别人的统计数字活着的那种判断力。
而这种判断力的全部要诀,只是两个动作:
每次有人给你一个数字,问一句——"这个数字里,有我吗?"
每次有人给你一个建议,问一句——"他赌了什么?"
把这两句话钉进墙上。它们会替你筛掉一生中绝大多数糟糕的建议、错误的下注、和无意义的焦虑。
而你,从生到死,只走这一条线。