02 实践论02 On Practice
没有调查,就没有算法No investigation, no algorithm
模型不是你的用户。它是全人类写下来的文本的一次有损压缩——它大致知道"统计意义上的一般人"想要什么,但它从没见过你那一千个具体的、活着的、有自己别扭逻辑的人。你用一句 prompt 问它"我的目标用户想要什么",把它吐出来的几百字当成真实需求,照着写 PRD——这就是 AI 时代的教条主义者:坐在屏幕前,把模型的世界观当成了对世界的调查。
毛泽东在《实践论》里给过这种人一句话:"你要知道梨子的滋味,你就得变革梨子,亲口吃一吃。"算法能逼近"梨子的平均滋味",可你的用户嘴里那只梨子,只有你亲口尝、或亲耳听他说,才知道是酸是涩。
先把出处钉死,免得有人拿这个给整篇文章打折扣:"没有调查,没有发言权"这句话、还有"本本主义"这个词,都不在《实践论》里——它们出自 1930 年的《反对本本主义》(原名《调查工作》)。《实践论》是七年后的版本,把同一件事做成了一套完整的认识论,批的对象在原文里叫"教条主义"和"经验主义"。两篇一头一尾:1930 年甩出结论,1937 年补上论证。我标题用《实践论》、却把"没有调查"接到算法上,正因为这是一条线,不是两件事。下文的"教条主义",用的是《实践论》自己的词。
一、教条主义的AI变体:拿模型的世界观,替代对用户的调查
《实践论》整篇只论证一件事:一切真知都从直接经验发源,认识开始于实践,离开实践的认识不可能成立。教条主义的错不在"读书",在于把书里的结论当成现实本身,用别人总结好的理论去裁剪眼前具体的人和事。
AI 把这个错的成本降到了几乎为零,于是它复活得比任何时候都凶。过去你要偷懒,至少还得翻几本行业报告、抄几份竞品分析,多少接触一点二手材料。现在你只要打一行字,模型三秒给你一份结构工整、措辞专业、看起来什么都懂的"用户画像"。它越流畅,你越容易忘记一件事:这份画像里没有一个字来自你的用户。它来自模型在训练时吃进去的、关于"一般用户""一般人性""一般产品"的统计规律。
"模型说用户想要 X"和"用户想要 X"之间,隔着整整一个认识论的鸿沟。LLM 学的是语料里反复出现、已经被写成常识的东西。它给你的洞察,多半落在已经进入共识的那一部分;真正能拉开差距的,往往在共识之外——还没被谁写下来、还没进任何语料、只活在某个具体用户没说出口的别扭里。模型当然能做非显然的组合和综合,这点别小看它;但你产品最硬的那块差异,通常不在"人人都问得到"的答案里。
二、间接经验不是原罪,不检验才是
毛从没说读书是退化——恰恰相反。《实践论》明确肯定间接经验:一个人的知识绝大部分来自间接经验——书本、前人的总结;这些东西对你是间接的,对写下它们的前人却是直接的,照样是真知。所以问题从来不是"二手"两个字。毛反对的,是把书里的结论当成现实本身、当成不必再检验的终点。
LLM 给你的,本质是间接经验的再一次压缩——它把前人写下的直接经验又嚼了一道。这不是罪,能用,而且常常好用。问题只卡在两个字:检验。你可以拿模型的输出当假设的起点,绝不能当结论的终点。教条主义者栽的不是"他用了二手材料",是"他把二手材料当成了不必验证的真理",省掉了亲口吃梨那一步。
模型最迷惑人的地方,是它的手感太好。它给你的东西永远通顺、自洽、没有矛盾;而真实用户永远混乱、自相矛盾、让你难受。一个真实用户上一句说"我特别需要这个功能",下一句的行为完全相反;他给你一个理由,真正的动机连他自己都没意识到。这种"毛刺"恰恰是信息所在。模型把所有毛刺磨平,给你一个光滑的、平均的、谁都不得罪的答案,而光滑的答案里没有任何一个真实的人。
我见过太多团队,拿模型生成的"用户旅程图"开了三个月的会,PPT 精美无比,没有一个人打过一个真实用户的电话。他们不是不够勤奋,是把勤奋用在了把假设当结论上——拿模型的输出当成了不必检验的终点,越走离用户越远,还以为自己在做研究。
三、数据不是调查:算法告诉你是什么,调查告诉你为什么
最难防的一种教条主义,穿着"数据驱动"的外衣,听起来无比正确。A/B test、埋点、留存曲线、情感分析——这些东西能极其精确地告诉你"是什么":哪个按钮点击率高,用户在第几天流失,哪类话术触发了更长的对话。它们几乎从不告诉你"为什么"。
我在苹果做 App Store 推荐系统时,最早就栽在这上面。算法优化的是点击和下载,因为这两个信号干净、好量化、能回传去训练模型。可点击不等于满意,下载不等于需要。一个用户点了你推的 app,可能只因为图标骚气,装完就删,心里其实在骂你。算法能告诉你"他点了",永远告诉不了你"他点完想骂人"。信号是"是什么",满意是"为什么",模型能拟合前者,碰不到后者——除非你真去问那个删了 app 的人为什么删。这是算法的认识论天花板:它能无限逼近一切可量化的信号,却够不到信号背后那个活人的真实状态。没有调查,就没有算法——算法只是把你调查来的认识自动化、规模化,它本身不下场调查。
毛写《湖南农民运动考察报告》之前,用三十二天,亲腿走了湘潭、湘乡、衡山、醴陵、长沙五个县,开了无数场座谈会。他要的不是"农民运动爆发了"这个"是什么"——这个谁都看得见;他要的是农民为什么在这个时间、用这种方式爆发,这个东西没有任何报表能给他,只能用腿和耳朵去换。这才是"没有调查,没有发言权"真正的分量:发言权不是用立场换的,是用脚底板的泥换的。
安心舍上线早期,我犯了一模一样的错。我们用 AI 分析了几十万条用户的情感数据,算法给出的画像很清晰:深夜活跃、负面情绪关键词密集、单次使用时长长。我们顺理成章地下了结论——这是一个危机干预工具,用户是在情绪最崩溃的时刻来找我们的。照着这个结论,我们加了一堆共情话术、危机热线入口、强干预设计。数据没怎么动。
后来我硬着头皮,跟十个用户一个一个单独深谈,每个人聊了一个多小时。十个里有八个告诉我的,跟数据画像完全是两回事:他们大多不是在"最崩溃"的时候来的,而是卡在"还没到崩溃、但不想麻烦任何活人"的那个夹缝里。一个用户的原话我到现在记得——"跟它说话,我不用欠谁的人情。"他们要的核心不是"被安慰",是"不被评判"加"不欠人情"。这个"为什么",几十万条数据一个字都没告诉我,十次深谈全告诉我了。
这个区别直接决定产品的生死方向。如果它是危机工具,我该做的是接热线、强共情、重干预;如果它是"一个不欠人情的日常出口",我该做的恰恰相反——把一切让人觉得"我正在被分析、被干预"的痕迹全抹掉,降低门槛,让它永远在、永远不累、永远不还嘴。两个方向做出来是两个完全不同的 app,而把我从错的那个方向拉回来的,不是任何算法,是十个小时的对话。
四、实践→认识→再实践:把每个洞察当成待证伪的假设
《实践论》给的不是一句格言,是一个闭环:"实践、认识、再实践、再认识,这种形式,循环往复以至无穷,而实践和认识之每一循环的内容,都比较地进到了高一级的程度。"翻成产品语言:调研→做出来→放回用户面前→再调研,无限循环,每一圈都比上一圈更接近真实。大多数团队的循环是断的,要么只做不验,要么只盯数据不见人——这两种毛病前面已经拆过,这一节只问一件事:没断的循环,靠什么一圈圈往上走?
靠的不是"做用户访谈"这个动作本身,是你对待每一圈认识的姿态:把它当成一个待证伪的假设,而不是一个已经成立的结论。LLM 给你的每一个洞察,都该按这个姿态处理——逻辑再完美,它也只是个在真空里养出来的漂亮模型,从没接触过你的现实。(这一点桥水的达里奥讲了一辈子:最危险的,永远是那个在你脑子里推演得天衣无缝、却从没被现实狠狠打过一次脸的模型。)
可证伪不是态度,是动作。拿到一个洞察,别去设计能证明它的实验,去设计能最快杀死它的实验——能用最小成本、最短时间把它推翻的那个。安心舍那次,如果我一开始就逼自己问"什么证据能立刻推翻'危机工具'这个判断",我根本不会等几十万条数据,我会先去打那十个电话。砸不碎的假设才留下,砸碎的越早越好。能 rollback 的代码错了可以回滚;建在二手认识之上、又从没被任何真实用户砸过的整个产品方向错了,没有 rollback。
毛那句"感觉到了的东西,我们不能立刻理解它,只有理解了的东西才能更深刻地感觉它",是这个闭环的内核。你得先有感觉——亲耳听到用户那句别扭的原话,才有东西可理解;理解之后再回去,你才能更深一层地感觉到下一个东西。AI 能帮你处理已经理解了的部分,永远替不了你去"感觉"。感觉这一步,必须用你自己的腿、自己的耳朵、自己一个小时一个小时的时间去换。
所以我想问你一个具体的问题,不是修辞——你上一次真正和一个用户深谈,不是看后台,不是读 NPS,不是问 LLM"我的用户为什么流失",而是和一个活生生的、会自相矛盾、连自己都没想清楚的人,面对面坐下来,听他讲一个小时——是哪一天?如果你想不起具体是哪一天,那你现在对用户的全部"认识",可能都长在二手压缩之上,一次都没被砸过。
模型不是你的用户。它是全人类写下来的文本的一次有损压缩——它大致知道"统计意义上的一般人"想要什么,但它从没见过你那一千个具体的、活着的、有自己别扭逻辑的人。你用一句 prompt 问它"我的目标用户想要什么",把它吐出来的几百字当成真实需求,照着写 PRD——这就是 AI 时代的教条主义者:坐在屏幕前,把模型的世界观当成了对世界的调查。
毛泽东在《实践论》里给过这种人一句话:"你要知道梨子的滋味,你就得变革梨子,亲口吃一吃。"算法能逼近"梨子的平均滋味",可你的用户嘴里那只梨子,只有你亲口尝、或亲耳听他说,才知道是酸是涩。
先把出处钉死,免得有人拿这个给整篇文章打折扣:"没有调查,没有发言权"这句话、还有"本本主义"这个词,都不在《实践论》里——它们出自 1930 年的《反对本本主义》(原名《调查工作》)。《实践论》是七年后的版本,把同一件事做成了一套完整的认识论,批的对象在原文里叫"教条主义"和"经验主义"。两篇一头一尾:1930 年甩出结论,1937 年补上论证。我标题用《实践论》、却把"没有调查"接到算法上,正因为这是一条线,不是两件事。下文的"教条主义",用的是《实践论》自己的词。
一、教条主义的AI变体:拿模型的世界观,替代对用户的调查
《实践论》整篇只论证一件事:一切真知都从直接经验发源,认识开始于实践,离开实践的认识不可能成立。教条主义的错不在"读书",在于把书里的结论当成现实本身,用别人总结好的理论去裁剪眼前具体的人和事。
AI 把这个错的成本降到了几乎为零,于是它复活得比任何时候都凶。过去你要偷懒,至少还得翻几本行业报告、抄几份竞品分析,多少接触一点二手材料。现在你只要打一行字,模型三秒给你一份结构工整、措辞专业、看起来什么都懂的"用户画像"。它越流畅,你越容易忘记一件事:这份画像里没有一个字来自你的用户。它来自模型在训练时吃进去的、关于"一般用户""一般人性""一般产品"的统计规律。
"模型说用户想要 X"和"用户想要 X"之间,隔着整整一个认识论的鸿沟。LLM 学的是语料里反复出现、已经被写成常识的东西。它给你的洞察,多半落在已经进入共识的那一部分;真正能拉开差距的,往往在共识之外——还没被谁写下来、还没进任何语料、只活在某个具体用户没说出口的别扭里。模型当然能做非显然的组合和综合,这点别小看它;但你产品最硬的那块差异,通常不在"人人都问得到"的答案里。
二、间接经验不是原罪,不检验才是
毛从没说读书是退化——恰恰相反。《实践论》明确肯定间接经验:一个人的知识绝大部分来自间接经验——书本、前人的总结;这些东西对你是间接的,对写下它们的前人却是直接的,照样是真知。所以问题从来不是"二手"两个字。毛反对的,是把书里的结论当成现实本身、当成不必再检验的终点。
LLM 给你的,本质是间接经验的再一次压缩——它把前人写下的直接经验又嚼了一道。这不是罪,能用,而且常常好用。问题只卡在两个字:检验。你可以拿模型的输出当假设的起点,绝不能当结论的终点。教条主义者栽的不是"他用了二手材料",是"他把二手材料当成了不必验证的真理",省掉了亲口吃梨那一步。
模型最迷惑人的地方,是它的手感太好。它给你的东西永远通顺、自洽、没有矛盾;而真实用户永远混乱、自相矛盾、让你难受。一个真实用户上一句说"我特别需要这个功能",下一句的行为完全相反;他给你一个理由,真正的动机连他自己都没意识到。这种"毛刺"恰恰是信息所在。模型把所有毛刺磨平,给你一个光滑的、平均的、谁都不得罪的答案,而光滑的答案里没有任何一个真实的人。
我见过太多团队,拿模型生成的"用户旅程图"开了三个月的会,PPT 精美无比,没有一个人打过一个真实用户的电话。他们不是不够勤奋,是把勤奋用在了把假设当结论上——拿模型的输出当成了不必检验的终点,越走离用户越远,还以为自己在做研究。
三、数据不是调查:算法告诉你是什么,调查告诉你为什么
最难防的一种教条主义,穿着"数据驱动"的外衣,听起来无比正确。A/B test、埋点、留存曲线、情感分析——这些东西能极其精确地告诉你"是什么":哪个按钮点击率高,用户在第几天流失,哪类话术触发了更长的对话。它们几乎从不告诉你"为什么"。
我在苹果做 App Store 推荐系统时,最早就栽在这上面。算法优化的是点击和下载,因为这两个信号干净、好量化、能回传去训练模型。可点击不等于满意,下载不等于需要。一个用户点了你推的 app,可能只因为图标骚气,装完就删,心里其实在骂你。算法能告诉你"他点了",永远告诉不了你"他点完想骂人"。信号是"是什么",满意是"为什么",模型能拟合前者,碰不到后者——除非你真去问那个删了 app 的人为什么删。这是算法的认识论天花板:它能无限逼近一切可量化的信号,却够不到信号背后那个活人的真实状态。没有调查,就没有算法——算法只是把你调查来的认识自动化、规模化,它本身不下场调查。
毛写《湖南农民运动考察报告》之前,用三十二天,亲腿走了湘潭、湘乡、衡山、醴陵、长沙五个县,开了无数场座谈会。他要的不是"农民运动爆发了"这个"是什么"——这个谁都看得见;他要的是农民为什么在这个时间、用这种方式爆发,这个东西没有任何报表能给他,只能用腿和耳朵去换。这才是"没有调查,没有发言权"真正的分量:发言权不是用立场换的,是用脚底板的泥换的。
安心舍上线早期,我犯了一模一样的错。我们用 AI 分析了几十万条用户的情感数据,算法给出的画像很清晰:深夜活跃、负面情绪关键词密集、单次使用时长长。我们顺理成章地下了结论——这是一个危机干预工具,用户是在情绪最崩溃的时刻来找我们的。照着这个结论,我们加了一堆共情话术、危机热线入口、强干预设计。数据没怎么动。
后来我硬着头皮,跟十个用户一个一个单独深谈,每个人聊了一个多小时。十个里有八个告诉我的,跟数据画像完全是两回事:他们大多不是在"最崩溃"的时候来的,而是卡在"还没到崩溃、但不想麻烦任何活人"的那个夹缝里。一个用户的原话我到现在记得——"跟它说话,我不用欠谁的人情。"他们要的核心不是"被安慰",是"不被评判"加"不欠人情"。这个"为什么",几十万条数据一个字都没告诉我,十次深谈全告诉我了。
这个区别直接决定产品的生死方向。如果它是危机工具,我该做的是接热线、强共情、重干预;如果它是"一个不欠人情的日常出口",我该做的恰恰相反——把一切让人觉得"我正在被分析、被干预"的痕迹全抹掉,降低门槛,让它永远在、永远不累、永远不还嘴。两个方向做出来是两个完全不同的 app,而把我从错的那个方向拉回来的,不是任何算法,是十个小时的对话。
四、实践→认识→再实践:把每个洞察当成待证伪的假设
《实践论》给的不是一句格言,是一个闭环:"实践、认识、再实践、再认识,这种形式,循环往复以至无穷,而实践和认识之每一循环的内容,都比较地进到了高一级的程度。"翻成产品语言:调研→做出来→放回用户面前→再调研,无限循环,每一圈都比上一圈更接近真实。大多数团队的循环是断的,要么只做不验,要么只盯数据不见人——这两种毛病前面已经拆过,这一节只问一件事:没断的循环,靠什么一圈圈往上走?
靠的不是"做用户访谈"这个动作本身,是你对待每一圈认识的姿态:把它当成一个待证伪的假设,而不是一个已经成立的结论。LLM 给你的每一个洞察,都该按这个姿态处理——逻辑再完美,它也只是个在真空里养出来的漂亮模型,从没接触过你的现实。(这一点桥水的达里奥讲了一辈子:最危险的,永远是那个在你脑子里推演得天衣无缝、却从没被现实狠狠打过一次脸的模型。)
可证伪不是态度,是动作。拿到一个洞察,别去设计能证明它的实验,去设计能最快杀死它的实验——能用最小成本、最短时间把它推翻的那个。安心舍那次,如果我一开始就逼自己问"什么证据能立刻推翻'危机工具'这个判断",我根本不会等几十万条数据,我会先去打那十个电话。砸不碎的假设才留下,砸碎的越早越好。能 rollback 的代码错了可以回滚;建在二手认识之上、又从没被任何真实用户砸过的整个产品方向错了,没有 rollback。
毛那句"感觉到了的东西,我们不能立刻理解它,只有理解了的东西才能更深刻地感觉它",是这个闭环的内核。你得先有感觉——亲耳听到用户那句别扭的原话,才有东西可理解;理解之后再回去,你才能更深一层地感觉到下一个东西。AI 能帮你处理已经理解了的部分,永远替不了你去"感觉"。感觉这一步,必须用你自己的腿、自己的耳朵、自己一个小时一个小时的时间去换。
所以我想问你一个具体的问题,不是修辞——你上一次真正和一个用户深谈,不是看后台,不是读 NPS,不是问 LLM"我的用户为什么流失",而是和一个活生生的、会自相矛盾、连自己都没想清楚的人,面对面坐下来,听他讲一个小时——是哪一天?如果你想不起具体是哪一天,那你现在对用户的全部"认识",可能都长在二手压缩之上,一次都没被砸过。