02 实践论02 On Practice

没有调查，就没有算法No investigation, no algorithm

更新 2026-06-26Updated 2026-06-26

模型不是你的用户。它是全人类写下来的文本的一次有损压缩——它大致知道"统计意义上的一般人"想要什么，但它从没见过你那一千个具体的、活着的、有自己别扭逻辑的人。你用一句 prompt 问它"我的目标用户想要什么"，把它吐出来的几百字当成真实需求，照着写 PRD——这就是 AI 时代的教条主义者：坐在屏幕前，把模型的世界观当成了对世界的调查。

毛泽东在《实践论》里给过这种人一句话："你要知道梨子的滋味，你就得变革梨子，亲口吃一吃。"算法能逼近"梨子的平均滋味"，可你的用户嘴里那只梨子，只有你亲口尝、或亲耳听他说，才知道是酸是涩。

先把出处钉死，免得有人拿这个给整篇文章打折扣："没有调查，没有发言权"这句话、还有"本本主义"这个词，都不在《实践论》里——它们出自 1930 年的《反对本本主义》（原名《调查工作》）。《实践论》是七年后的版本，把同一件事做成了一套完整的认识论，批的对象在原文里叫"教条主义"和"经验主义"。两篇一头一尾：1930 年甩出结论，1937 年补上论证。我标题用《实践论》、却把"没有调查"接到算法上，正因为这是一条线，不是两件事。下文的"教条主义"，用的是《实践论》自己的词。

一、教条主义的AI变体：拿模型的世界观，替代对用户的调查

《实践论》整篇只论证一件事：一切真知都从直接经验发源，认识开始于实践，离开实践的认识不可能成立。教条主义的错不在"读书"，在于把书里的结论当成现实本身，用别人总结好的理论去裁剪眼前具体的人和事。

AI 把这个错的成本降到了几乎为零，于是它复活得比任何时候都凶。过去你要偷懒，至少还得翻几本行业报告、抄几份竞品分析，多少接触一点二手材料。现在你只要打一行字，模型三秒给你一份结构工整、措辞专业、看起来什么都懂的"用户画像"。它越流畅，你越容易忘记一件事：这份画像里没有一个字来自你的用户。它来自模型在训练时吃进去的、关于"一般用户""一般人性""一般产品"的统计规律。

"模型说用户想要 X"和"用户想要 X"之间，隔着整整一个认识论的鸿沟。LLM 学的是语料里反复出现、已经被写成常识的东西。它给你的洞察，多半落在已经进入共识的那一部分；真正能拉开差距的，往往在共识之外——还没被谁写下来、还没进任何语料、只活在某个具体用户没说出口的别扭里。模型当然能做非显然的组合和综合，这点别小看它；但你产品最硬的那块差异，通常不在"人人都问得到"的答案里。

二、间接经验不是原罪，不检验才是

毛从没说读书是退化——恰恰相反。《实践论》明确肯定间接经验：一个人的知识绝大部分来自间接经验——书本、前人的总结；这些东西对你是间接的，对写下它们的前人却是直接的，照样是真知。所以问题从来不是"二手"两个字。毛反对的，是把书里的结论当成现实本身、当成不必再检验的终点。

LLM 给你的，本质是间接经验的再一次压缩——它把前人写下的直接经验又嚼了一道。这不是罪，能用，而且常常好用。问题只卡在两个字：检验。你可以拿模型的输出当假设的起点，绝不能当结论的终点。教条主义者栽的不是"他用了二手材料"，是"他把二手材料当成了不必验证的真理"，省掉了亲口吃梨那一步。

模型最迷惑人的地方，是它的手感太好。它给你的东西永远通顺、自洽、没有矛盾；而真实用户永远混乱、自相矛盾、让你难受。一个真实用户上一句说"我特别需要这个功能"，下一句的行为完全相反；他给你一个理由，真正的动机连他自己都没意识到。这种"毛刺"恰恰是信息所在。模型把所有毛刺磨平，给你一个光滑的、平均的、谁都不得罪的答案，而光滑的答案里没有任何一个真实的人。

我见过太多团队，拿模型生成的"用户旅程图"开了三个月的会，PPT 精美无比，没有一个人打过一个真实用户的电话。他们不是不够勤奋，是把勤奋用在了把假设当结论上——拿模型的输出当成了不必检验的终点，越走离用户越远，还以为自己在做研究。

三、数据不是调查：算法告诉你是什么，调查告诉你为什么

最难防的一种教条主义，穿着"数据驱动"的外衣，听起来无比正确。A/B test、埋点、留存曲线、情感分析——这些东西能极其精确地告诉你"是什么"：哪个按钮点击率高，用户在第几天流失，哪类话术触发了更长的对话。它们几乎从不告诉你"为什么"。

我在苹果做 App Store 推荐系统时，最早就栽在这上面。算法优化的是点击和下载，因为这两个信号干净、好量化、能回传去训练模型。可点击不等于满意，下载不等于需要。一个用户点了你推的 app，可能只因为图标骚气，装完就删，心里其实在骂你。算法能告诉你"他点了"，永远告诉不了你"他点完想骂人"。信号是"是什么"，满意是"为什么"，模型能拟合前者，碰不到后者——除非你真去问那个删了 app 的人为什么删。这是算法的认识论天花板：它能无限逼近一切可量化的信号，却够不到信号背后那个活人的真实状态。没有调查，就没有算法——算法只是把你调查来的认识自动化、规模化，它本身不下场调查。

毛写《湖南农民运动考察报告》之前，用三十二天，亲腿走了湘潭、湘乡、衡山、醴陵、长沙五个县，开了无数场座谈会。他要的不是"农民运动爆发了"这个"是什么"——这个谁都看得见；他要的是农民为什么在这个时间、用这种方式爆发，这个东西没有任何报表能给他，只能用腿和耳朵去换。这才是"没有调查，没有发言权"真正的分量：发言权不是用立场换的，是用脚底板的泥换的。

安心舍上线早期，我犯了一模一样的错。我们用 AI 分析了几十万条用户的情感数据，算法给出的画像很清晰：深夜活跃、负面情绪关键词密集、单次使用时长长。我们顺理成章地下了结论——这是一个危机干预工具，用户是在情绪最崩溃的时刻来找我们的。照着这个结论，我们加了一堆共情话术、危机热线入口、强干预设计。数据没怎么动。

后来我硬着头皮，跟十个用户一个一个单独深谈，每个人聊了一个多小时。十个里有八个告诉我的，跟数据画像完全是两回事：他们大多不是在"最崩溃"的时候来的，而是卡在"还没到崩溃、但不想麻烦任何活人"的那个夹缝里。一个用户的原话我到现在记得——"跟它说话，我不用欠谁的人情。"他们要的核心不是"被安慰"，是"不被评判"加"不欠人情"。这个"为什么"，几十万条数据一个字都没告诉我，十次深谈全告诉我了。

这个区别直接决定产品的生死方向。如果它是危机工具，我该做的是接热线、强共情、重干预；如果它是"一个不欠人情的日常出口"，我该做的恰恰相反——把一切让人觉得"我正在被分析、被干预"的痕迹全抹掉，降低门槛，让它永远在、永远不累、永远不还嘴。两个方向做出来是两个完全不同的 app，而把我从错的那个方向拉回来的，不是任何算法，是十个小时的对话。

四、实践→认识→再实践：把每个洞察当成待证伪的假设

《实践论》给的不是一句格言，是一个闭环："实践、认识、再实践、再认识，这种形式，循环往复以至无穷，而实践和认识之每一循环的内容，都比较地进到了高一级的程度。"翻成产品语言：调研→做出来→放回用户面前→再调研，无限循环，每一圈都比上一圈更接近真实。大多数团队的循环是断的，要么只做不验，要么只盯数据不见人——这两种毛病前面已经拆过，这一节只问一件事：没断的循环，靠什么一圈圈往上走？

靠的不是"做用户访谈"这个动作本身，是你对待每一圈认识的姿态：把它当成一个待证伪的假设，而不是一个已经成立的结论。LLM 给你的每一个洞察，都该按这个姿态处理——逻辑再完美，它也只是个在真空里养出来的漂亮模型，从没接触过你的现实。（这一点桥水的达里奥讲了一辈子：最危险的，永远是那个在你脑子里推演得天衣无缝、却从没被现实狠狠打过一次脸的模型。）

可证伪不是态度，是动作。拿到一个洞察，别去设计能证明它的实验，去设计能最快杀死它的实验——能用最小成本、最短时间把它推翻的那个。安心舍那次，如果我一开始就逼自己问"什么证据能立刻推翻'危机工具'这个判断"，我根本不会等几十万条数据，我会先去打那十个电话。砸不碎的假设才留下，砸碎的越早越好。能 rollback 的代码错了可以回滚；建在二手认识之上、又从没被任何真实用户砸过的整个产品方向错了，没有 rollback。

毛那句"感觉到了的东西，我们不能立刻理解它，只有理解了的东西才能更深刻地感觉它"，是这个闭环的内核。你得先有感觉——亲耳听到用户那句别扭的原话，才有东西可理解；理解之后再回去，你才能更深一层地感觉到下一个东西。AI 能帮你处理已经理解了的部分，永远替不了你去"感觉"。感觉这一步，必须用你自己的腿、自己的耳朵、自己一个小时一个小时的时间去换。

所以我想问你一个具体的问题，不是修辞——你上一次真正和一个用户深谈，不是看后台，不是读 NPS，不是问 LLM"我的用户为什么流失"，而是和一个活生生的、会自相矛盾、连自己都没想清楚的人，面对面坐下来，听他讲一个小时——是哪一天？如果你想不起具体是哪一天，那你现在对用户的全部"认识"，可能都长在二手压缩之上，一次都没被砸过。

一、教条主义的AI变体：拿模型的世界观，替代对用户的调查

二、间接经验不是原罪，不检验才是

三、数据不是调查：算法告诉你是什么，调查告诉你为什么

四、实践→认识→再实践：把每个洞察当成待证伪的假设