来源 | 孤独大脑(ID:lonelybrain)
在某个论坛上,埃隆·马斯克面对这个问题,足足想了30秒,给出了一个非常精彩的回答:可纠错的反馈闭环,几乎是“创业、投资、成长”等问题的核心答案。然而,如果不能将其与贝叶斯公式的计算结合起来,这个提法就和所有解释性概念一样,只能作为一篇热销文章或图书的标题而已。反之亦然。贝叶斯公式伴随着AI的再次火热,又频繁出现在人们面前。本文将从“可纠错的反馈闭环”和“贝叶斯公式”两头出发,给出一个不确定年代尤显重要的思考和行动框架:5、对新信息保持“敏感”,又有独立判断的“钝感”;8、探索未知 & 利用已知,在攻和守之间进行权衡;基于以上9个要点,我们就能更完整地理解“可纠错的反馈闭环”。这是贝叶斯主义的现实模型,也是“真正的高手”的秘密。贝叶斯主义是一种关于概率和统计的哲学观点,它强调信念的主观性和更新。在该观点中,贝叶斯公式是一个核心的工具,用于处理不确定性,更新信念,并指导决策。总的来说,贝叶斯公式与很多关于知识、学习、不确定性和决策的哲学思想有关。它提供了一种强大的框架,用于理解和处理这些复杂的问题。以下,是一位贝叶斯主义者的九个策略。
大约是在三年前,一位年轻的老师有很好的内容,想在抖音和视频号上做自己的IP,但是她又担心:万一自己辛苦一番,抖音和视频号又不火了呢?“确保成功”,似乎是很多人做决定的前提。但这个世界上并没有什么事情是确定的。残酷的一面是,越是追求”确保成功“的人,反而越脆弱,越容易掉入决策的陷阱。例如,市面上的种种骗术都是以”确保成功“为吸引点的。不光骗子如此,流行文化,甚至主流文化也因为实用主义的偏好,而形成了“要么成功要么失败”的黑白分明价值观。于是,面对不确定性,黑白分明的世界观容易产生两种极端的行为:- 要么“不见兔子不撒鹰”,追求不存在的“确保成功”;
- 要么“人生就是赌一把”,见一个热点就“All in”一个。
3、即使存在如上不确定性,世界也很难精确预测,但我们仍然可以用概率来描述世界;4、从世俗成败的角度看,赢家只需要在局部获得相对优势,就能够领先于对手。所以,很多赢家只要获胜的概率比赢家多几个百分点,就能够成功;5、基于概率的认知和判断,是一个不断逼近、不断进化的过程。对不确定性的接受和理解,是贝叶斯思维的核心。我们需要接受事物的不确定性,并利用概率来描述和理解它。面对不确定性,贝叶斯思想鼓励我们不怕犯错误,尝试新的事物,从失败中学习,调整策略,这与实现个人成长的过程非常匹配。概率不仅用于量化现实世界的不确定性,也用于评估我们自己的质量。在面临选择时,贝叶斯思维鼓励我们基于概率来做决策,而非绝对肯定或否定。这能够帮助年轻人更好地处理复杂的决策问题。桥水基金使用了一种称为"贝叶斯加权"的决策过程,这个过程明确地将贝叶斯推理纳入了决策过程中。该公司使用算法来分配决策权重,这是一种基于贝叶斯推理的决策过程,对于每一个决策,该公司都会将决策者的可靠性、专业知识等因素考虑进来,然后根据这些因素分配权重,最终做出决策。贝叶斯主义认为,概率是一个假设的信念。例如:某只股票明天上涨的概率是多大?你可以说:我认为上涨的概率是30%。这是一种主观的信念,并且你会根据更多的信息随时更新自己的信念。所以,面对不确定性,对于某件你感兴趣的事情,你可以大概有一个评估,然后先干起来再说。假设一个公司在其网站上运行了两种广告:广告A和广告B,目标是找出哪种广告的点击率更高。初始时,公司并不知道哪种广告的效果更好,因此,他们假设两种广告的点击率都是50%。公司开始在网站上随机展示这两种广告。每次有用户点击了广告,公司就会收到一个反馈。根据这个反馈,公司就可以更新他们对广告点击率的估计。具体的更新也是通过贝叶斯公式来完成。例如,如果一个用户点击了广告A,那么公司就会提高他们对广告A点击率的估计;如果用户没有点击,那么公司就会降低他们对广告A点击率的估计。通过不断的实验和更新,公司最终会找出哪种广告的效果更好。从上述被简化了的例子,我们大约可以将公司或者个人分为两种:a、遇到不同策略选择时,一群人讨论来分析去;b、遇到不同策略选择时,把几种看起来可行的都试一下。人们总说腾讯喜欢用赛马机制,最经典的例子是微信的诞生--几个团队一起开发,看最后谁跑出来。用“赛马”来描述该策略,并不精确。因为赢家并非是最快的,而是最适应的。而这种适应性无法预测,只能先将几种策略一起跑跑看。贝叶斯更新是一种方法,它使用贝叶斯公式来更新我们对某个假设的信念。具体来说,贝叶斯更新包括以下步骤:1、我们首先有一个对某个假设(例如,某封邮件是垃圾邮件)的先验信念。这个信念通常表示为一个概率。2、然后,我们收集新的数据,这些数据可能会影响我们对假设的信念。在贝叶斯统计中,我们使用贝叶斯公式将这些新的数据与我们的先验信念结合起来,得到一个更新的信念,这个更新的信念被称为后验信念。我们的信念不是固定不变的,而是可以根据新的数据进行更新的。而贝叶斯公式提供了一个理论框架,指导我们如何根据新的数据更新我们的信念。
3、先干为敬。
02
策略二
快速行动和迭代
打造“知行一体”的反馈飞轮
贝叶斯思想强调快速迭代、快速行动。只有通过实践,我们才能得到反馈,从而不断学习和进步。
知行合一,简称知行,是明朝政治家、哲学家王守仁阐述的一种哲学与世界观的方法。在知与行的关系上,王守仁从“天地万物本吾一体”出发,强调要知,更要行,知中有行,行中有知,所谓“知行合一”,二者互为表里,不可分离。知必然要表现为行,不行则不能算真知。P(H|E) = [P(E|H) * P(H)] / P(E)- P(H|E) 是后验概率,即在观察到新的数据E后,假设H成立的概率;
- P(E|H) 是似然度,即在假设H成立的情况下,观察到数据E的概率;
- P(H) 是先验概率,即在没有观察到新的数据前,假设H成立的概率;
- P(E) 是证据或边缘概率,即无论假设是否成立,观察到数据E的总概率。
在这个公式中,决策者,又或者是智能体,通过计算后验概率,将新的观察数据(E)和原有的信念(H)整合在一起。这个后验概率可以用于指导智能体的后续行动,例如在强化学习中选择哪一个动作。让我们用一个简单的贝叶斯计算,来看看人(或是“智能体”)如何学习经验。题目:黑盒子里有两个骰子,一个是正常骰子,扔出数字6的概率是1/6;一个是作弊骰子,扔出数字6的概率是1/2。在没有观察到新的数据前,这个骰子可能是正常骰子,也可能是作弊骰子,概率各为1/2,这是先验概率。现在,根据信息“扔出数字6”,来计算这个骰子是正常骰子和作弊骰子的概率分别是多大。是正常骰子的概率为:1/6 ÷(1/6+1/2)=1/4是作弊骰子的概率为:1/2 ÷(1/6+1/2)=3/4通过贝叶斯更新,更新这个骰子的信息。原来的先验概率是各1/2,但现在后验概率分别是1/4(正常骰子)和3/4(作弊骰子)。这里的关键是:将上面的到的后验概率变成新的一轮计算的先验概率。再得到一个6的概率计算,相当于在更新之后的先验概率基础之上做预测,计算如下:从本质层面理解如上这个简单的计算并不是容易的事情:两次扔骰子都是独立事件,为什么第一次扔骰子得到6的概率和第二次的概率不一样?贝叶斯概率的解释是,第一次扔骰子得到6的这一结果,作为信息,更新了我们对第二次扔骰子得到6的概率的判断。疑惑的人会继续问:骰子没有记忆,为什么第一次的结果会“改变”第二次结果呢?即使扔了两次骰子,我们依然不知道这个骰子是正常的还是作弊的,但我们可以带着这种不确定性向前走,为此需要“猜”这个骰子是正常还是作弊的概率。这个概率,就是信念。根据信息的变化,快速更新,体现了某种达尔文式的进化。从这个角度看,贝叶斯推理起初或许弱小含混,却有主动适应性,从经验中不断学习,并快速演化。以本题为例:第二次扔骰子,从第一次骰子的结果中学习了经验,从而令预测更加精确。这个过程还可以不断重复,如同发动机般,从而产生了决策和智能的杠杆效应。--这一点,我将在下一节详细阐释。在人工智能中,智能体通常通过从经验中学习来变得更加“聪明”。这种学习通常涉及到对环境的观察,通过这些观察来改变智能体的行为。这种改变可能是通过改变智能体对世界的理解(即它的模型),或者是通过改变智能体决定采取什么样的行动(即它的策略)。贝叶斯公式在这个过程中起到了关键的作用。这是因为贝叶斯公式提供了一种方法,可以将新的数据(或观察)与我们现有的信念结合起来,从而得到更新的信念。这种更新的过程,也就是贝叶斯更新,是学习的一个关键部分。通过贝叶斯更新,智能体可以从每一次的观察和交互中学习,不断地更新它对世界的理解。这样,智能体就可以不断地改进它的模型和策略,从而变得更加“聪明”。对高手而言,贝叶斯公式描述的是一个观念更新的过程:初始信念(先验概率)-大胆行动(获得新信息)-更新信念(后验概率)。人(智能体)通过贝叶斯公式,把知识(经验)和行动(决策)整合在一起了。从哲学的角度来看,贝叶斯公式反映了一种"学习的哲学":我们的信念应该是灵活的,能够在新的证据面前进行调整。在这种观念下,智能体不是单纯地根据新的观察来行动,也不是固执地依据旧的信念行动,而是通过贝叶斯公式,将新的观察和旧的信念结合起来,形成一种更新、更有信息的信念,以此来指导行动。我们的知识、理解和决策都是在不断变化和发展的,它们是通过反复的学习、试验和调整,逐渐逼近真实世界的复杂性的。由此,我们可以觉察到:“知行合一”这个词可能被误用了。例如,我有个做地产的朋友,好几年前就判断大势下行,准备尽快变现,但直到这两年才大力行动,但似乎已经错过最佳时机了。他是个认知和行动能力都极高的人,但仍然谦虚地反省自己不够“知行合一”。事实上,按照贝叶斯主义的哲学,“知行合一”绝非是“知”与“行”的一致性,知和行是彼此为踏脚石,互相推动更新。我们的“知”,包括旧知(经验)和新知(根据新信息更新后的经验)。但从时候看,我们经常会混淆“新信息”和“新知”。例如,人们经常会懊恼地说,我早就知道股票A会大涨100%,一月份的时候我就观察到一些新信息来证明这一点了。人们喜欢将此解释为“我行动力不够强”,又或是“我太懒了”,但事实也许并非如此。人对自己是诚实的,你有一个“证明该股票能涨100%的新信息”,但这个新信息并没有战胜你的旧知(经验),即使是在该信息的更新下,你的后验概率依然没有给你足够的信心去买入该股票。概括而言,贝叶斯公式通过提供一种系统化的方法来更新信念,使得智能体能够从经验中学习,并不断地改进自己的模型和策略,从而变得更加“聪明”。
没错,假如没有自己的模型,不是基于一个系统,贝叶斯公式并不能帮助一个人成为真正的高手。
03
策略三
用贝叶斯公式
实现“有系统”的复利效应
贝叶斯主义者,需要有自己的模型,基于一个系统,通过不断重复的连续性策略,产生复利效应。
贝叶斯更新就像复利一样,将之前的学习结果积累起来,作为新一轮学习的基础。这就是所谓的"站在巨人的肩膀上"。我在《人生算法》里提及的,基于某个内核,然后大规模重复,也是这个意思。
真正的高手,有自己的内核,自己的系统,过的是一种“有算法的人生”。关于贝叶斯主义的复利,最好的办法是用一个可计算的例子来示范。满满两口袋筹码放在被试面前,每只口袋里都有红白两种颜色的筹码。其中一只口袋里,75%的筹码是白色,25%的筹码是红色。另一只口袋里正好相反,75%是红色,25%是白色。被试随机挑选一只口袋,然后把筹码一个接一个往外拿,其间不得向袋子里面看。每拿出一个筹码,他都需向研究人员汇报他的猜测:他手中的袋子究竟是白色筹码居多,还是红色筹码居多?假如你拿出红色的筹码,根据贝叶斯公式计算,你肯定会猜,来自红色筹码多的袋子的可能性更大。请注意,问题来了:假如连续三次都拿出了红色的筹码,你认为来自红色筹码居多的袋子的概率是另一种的多少倍?在实验中,被试者认为来自红色筹码居多袋子的概率变成3倍。实际上呢?根据贝叶斯公式计算,其实概率变成了27倍。(以上案例来自《思维的发现》,原文叙述有含糊之处,我略作调整。该过程我在此前的文章里做过计算。)如上计算,生动而直观地呈现出了贝叶斯计算的指数式增长的复利效应。这里的关键词,除了“系统、内核、大规模重复、复利”,还有一个词:计算机和人工智能的出现对贝叶斯公式的应用产生了重大影响。虽然贝叶斯公式在18世纪就被提出了,但在很长一段时间里,由于计算需求,它在实践中的应用受到了限制。然而,计算机的出现改变了这一点。1、计算能力的提升: 贝叶斯公式的应用,特别是在复杂的情况下,需要大量的计算。计算机的出现使得这些计算成为可能,使得我们可以更有效地应用贝叶斯公式。2、数据的增长: 贝叶斯公式的应用需要数据,而在数字化时代,我们拥有了前所未有的大量数据。这些数据提供了更多的证据,使我们能够更好地应用贝叶斯公式来更新我们的信念。3、算法的进步: 计算机和人工智能的发展不仅提供了计算能力,还提供了更先进的算法。例如,马尔可夫链蒙特卡洛(MCMC)算法就是一种用于进行复杂贝叶斯计算的方法,它的发展和应用在很大程度上得益于计算机和人工智能的进步。4、实现自动化: 计算机和AI的出现,使得贝叶斯公式的使用可以自动化,不需要人工进行复杂的计算。这使得贝叶斯公式在各种情况下,如机器学习、自动驾驶等,都得以广泛应用。可以说,技术的发展使得贝叶斯公式更强大,提供了我们理解和处理不确定性、做出决策的新工具。2、数字化和AI可以令其自动化,并以更大规模自我复制和进化。
04
策略四
重视基础概率
基于整体资产滚雪球
基础概率是老生常谈的话题。
这里面的基础概率,大约包含“空间、时间、可能性”这三种。例如,中国的首富一直是农夫山泉的老板,一个重要的原因是:2022年中国饮料市场约为12478亿,其中包装饮用水占比约为62.7%。基数够大。水深鱼大。这是关于空间的基础概率。投资者经常基于过去的走势来预测股票的未来表现,但忽视了基础概率。过去的走势并不能保证未来的表现,每一次的市场表现都是独立的。人们经常因为局部时间的涨跌概率,而忽视了更长时间的基础概率(涨或跌)。有句话说:近处很难预测,远处反而容易预测。这里所说的远期预测,更像是相对稳定的基础概率。例如,赌场的游戏中,每种游戏的胜率都对赌场有利,这是基础概率。但是许多赌博者可能因为赢了几次而过度自信,认为自己有战胜赌场的策略或者运气。他们忽视了赌博的基础概率。这一节的话题,倒像是关于复利本质的探讨。对于滚雪球者,要有自己的内核(先验概率),才能滚起雪球。基础概率(Base Rate):基础概率是关于一个类别、事件或条件的总体频率。例如,假设你想知道一个随机选中的人是否有某种罕见疾病,那么这种疾病在总体中的发病率就是基础概率。基础概率是没有任何额外信息的情况下的默认概率。先验概率(Prior Probability):在贝叶斯统计中,先验概率是在观察到新证据之前,我们对某一假设成立的信念。例如,你可能已经知道在一个特定的地方,人们患某种疾病的概率比总体的基础概率要高。这就形成了你对这个人是否患有这种疾病的先验概率。一般来说,当我们获得新的证据时,我们会利用贝叶斯定理更新我们的先验概率,得到后验概率。基础概率可以被看作是一种特殊的先验概率,即没有任何特定证据的先验概率。我们做决策的时候,要眼观全局,基于整体资产来选择,并以整体资产的增长率来评判决策与行动的质量。
05
策略五
对新信息保持“敏感”
又有独立判断的“钝感”
好的思想都是基于某种看似对抗的张力。
贝叶斯公式告诉我们,对新信息保持“敏感”,又要考虑基础概率和先验概率,保持独立判断的“钝感”。1、对新信息保持“敏感”:贝叶斯公式告诉我们,当新信息(证据)到来时,我们应该更新我们的信念(概率)。这种对新信息的"敏感"表现在我们如何根据新的证据来修正我们的看法。例如,如果你是一个产品经理,当你得到用户反馈说你的产品有某些问题时,你应该更新你对产品质量的评估。2、考虑基础概率和先验概率,保持独立判断的“钝感”:然而,我们不能盲目地只考虑新信息,还需要考虑基础概率和先验概率。这意味着我们需要结合我们的初始信念和新的证据来更新我们的看法。例如,如果我们的产品在测试阶段已经表现得非常好(这就是先验概率),那么,即使我们收到了一些负面的用户反馈,我们也不能立即得出产品质量差的结论。我们需要权衡我们的初步信念(产品质量好)和新的证据(负面反馈)。这样的平衡使我们既对新信息保持敏感,又能保持对我们初步信念的忠实,避免被一些可能的偶然事件或者噪音所误导。这是一种“钝感”,因为它需要我们不被单一的证据所左右,而是要有独立的判断能力。在实践中,这意味着我们不能仅仅根据一次或几次的失败就对自己的能力或者一个项目的可能性产生怀疑。我们需要考虑我们的长期经验(先验概率),同时也要对新的反馈保持开放。用句俗话说,就是:听人劝、吃饱饭,但又不能听风就是雨。这大概是“控制情绪”之重要性的本质吧,假如你很容易因为某个鲜活的信息过于兴奋或者过于恼怒,过于重视一些短期的或者偶发的事件,忽视了长期的趋势或者基础的概率,就很难成为一名贝叶斯主义的高手。我们在接收新信息时需要进行权衡的重要性,避免被某一次的信息或者事件左右,而是要看看更大的数据和更长的时间线。贝叶斯理论强调对不确定性的认识,鼓励对新信息、新知识、新观念保持开放,这有助于我们认识到自己的知识或能力可能存在的局限,防止过度自信。更进一步,贝叶斯主义者有自己的内核,有自己的系统,也就有更多的数据。所以,当遇到新信息时,应该让数据说话。高手需要学会如何使用数据来支持他们的决策系统,而不仅仅依赖于直觉。
别太完美
降低自己被证伪的概率
贝叶斯推理和波普尔的证伪主义可能看似截然不同,但是它们其实在某种程度上是相似的。
1、贝叶斯推理: 在这个框架中,我们根据新的证据不断地更新我们的信念。我们不断地在我们的模型或者理论中添加新的信息,并基于这些信息调整我们的预测。最关键的是,我们不会彻底抛弃旧的信念,但是我们会根据新的证据进行调整。2、波普尔的证伪主义: 在这个框架中,我们设立假设,并试图找到证据来反驳这个假设。如果我们找到了这样的证据,我们就会彻底放弃这个假设。如果我们没有找到这样的证据,我们会继续保持这个假设,但是我们仍然要持续寻找可能反驳这个假设的证据。这两种思想的一个共同点是,它们都强调了试错过程和持续学习的重要性:在贝叶斯推理中,我们通过观察和学习来改进我们的预测;在波普尔的证伪主义中,我们通过试图证伪我们的假设来改进我们的理论。然而,这两种思想的一个关键区别是,贝叶斯推理允许我们结合新旧信息,而证伪主义则更倾向于抛弃被证伪的理论。换句话说,贝叶斯推理倾向于逐步改进我们的模型,而证伪主义倾向于寻找突破性的改变。比如在机器学习中,我们会使用贝叶斯方法来更新我们对模型参数的信念,但同时,我们也会尝试找到那些能够证伪我们当前最优模型的数据,这样可以帮助我们发现更好的模型。事实上,识别邮件是垃圾邮件,就是证伪“该邮件是正常邮件”。为了简单起见,我们假设有两个单词"赚钱"和"优惠",我们想知道一封包含这两个词的邮件是否是垃圾邮件。
1、有100封邮件是垃圾邮件,其中"赚钱"这个词出现在90封邮件中,"优惠"这个词出现在60封邮件中。2、有100封邮件是正常邮件,其中"赚钱"这个词出现在10封邮件中,"优惠"这个词出现在30封邮件中。我们首先计算单词"赚钱"和"优惠"在垃圾邮件和正常邮件中的概率:1、P(赚钱|垃圾邮件) = 90/100 = 0.92、P(优惠|垃圾邮件) = 60/100 = 0.63、P(赚钱|正常邮件) = 10/100 = 0.14、P(优惠|正常邮件) = 30/100 = 0.3另外,我们假设垃圾邮件和正常邮件的先验概率是相同的,都是0.5,因此:现在,我们使用贝叶斯公式来计算一封包含"赚钱"和"优惠"两个词的邮件是垃圾邮件的概率:P(垃圾邮件|赚钱, 优惠) = P(赚钱, 优惠|垃圾邮件) * P(垃圾邮件) / P(赚钱, 优惠)P(赚钱, 优惠|垃圾邮件) = P(赚钱|垃圾邮件) * P(优惠|垃圾邮件) = 0.9 * 0.6 = 0.54P(赚钱, 优惠|正常邮件) = P(赚钱|正常邮件) * P(优惠|正常邮件) = 0.1 * 0.3 = 0.03P(赚钱, 优惠) = P(赚钱, 优惠|垃圾邮件) * P(垃圾邮件) + P(赚钱, 优惠|正常邮件) * P(正常邮件) = 0.54 * 0.5 + 0.03 * 0.5 = 0.285P(垃圾邮件|赚钱, 优惠) = P(赚钱, 优惠|垃圾邮件) * P(垃圾邮件) / P(赚钱, 优惠) = 0.54 * 0.5 / 0.285 = 0.95这个结果表明,一封包含"赚钱"和"优惠"两个词的邮件有95%的概率是垃圾邮件。“赚钱”和“优惠”证伪了“该邮件是一封正常邮件”。但是,根据上面的计算,还是有5%的概率不是垃圾邮件。如果非常重要的邮件因此被归为垃圾邮件,后果是否很严重?这正是贝叶斯垃圾邮件过滤器面临的一个常见问题:误报。解决这个问题的一种方法是调整过滤器的阈值。在上面的例子中,我们可以设定一个规则,例如只有当一封邮件被判定为垃圾邮件的概率超过99%时,我们才将其归为垃圾邮件。这样可以显著降低误报的概率,但代价是可能会有更多的垃圾邮件漏过过滤器。另一种方法是使用更复杂的模型,例如包含更多特征的模型,或者使用深度学习等方法。这些模型可能会提供更好的性能,但同时也会更复杂,需要更多的计算资源。当你有一个先验概率的时候,你继续获取信息,极可能会主动选择那些对你的观念(先验概率)有利的,自动屏蔽不利的。通过贝叶斯公式,我们可以看到证伪或否定证据的重要性。批判性思维和证伪思维是科学研究的核心,也是保持思维开放、防止陷入偏见和过度确定的重要工具。2、少点儿人设,少点儿标签,否则更易被证伪,装逼被雷劈;3、阴谋论绝大多数都是假的,因为有太多假设,太容易被证伪。
贝叶斯公式的原理和哲学与适应性和进化理性有深度的关联。我们可以从以下几个方面来进行理解:
1、学习和适应性:贝叶斯公式是基于新的数据更新我们的观念和信念,这种动态调整和学习的过程与生物的适应性有很强的相似性。生物在环境中通过进化来适应环境,而贝叶斯公式则提供了一种在不断变化的数据环境中更新理解和决策的方式。2、不确定性和进化理性:贝叶斯方法是一种处理不确定性的方法,它接受并积极地使用不确定性,而不是尝试消除它。这种对不确定性的认识与进化理性的概念相吻合。进化理性是一种认识到我们的决策可能并不总是理性的,但是在进化的过程中,它们为我们的祖先提供了生存的优势。在这个意义上,即使面临不确定性,贝叶斯方法也能够提供最优或至少是足够好的决策。3、动态更新和适应环境:生物在自然界中要生存,需要根据环境变化做出适应性变化,而贝叶斯公式则提供了一种思维模式,让我们能够根据新的信息动态更新我们的观点和决策,以最好的方式适应我们所在的环境。4、淘汰错误的假设:贝叶斯公式中,一种假设(或模型)的概率会根据观察到的数据进行更新。如果一个假设持续得到的数据支持较少,它的概率就会变小,这就像自然选择过程中适应度较低的物种被淘汰一样。这种思想与进化论中的"适者生存"原则相一致。综上所述,贝叶斯公式的原理和哲学与适应性和进化理性之间存在紧密的联系,它们都强调了对新信息的接收、动态更新和在不确定性中做出最优决策的重要性。我经常批评“知识集邮者”,他们只是收集知识。高手有自己的知识花园,有自己的实践系统,有某个细分领域之内的基于数据、经验和专业的滚雪球人生,而非掰苞米人生。3、你的机器每天都比之前聪明一点点。
08
策略八
探索未知 & 利用已知
在攻和守之间进行权衡
在贝叶斯决策过程中,需要在探索未知和利用已知之间进行权衡。
多臂赌博机问题是一个典型的决策理论问题。这个名字来自于赌场里的老虎机,也叫做"一臂赌博机",因为它有一个"手臂",你拉下这个手臂就可以开始游戏。在这个问题中,你面前有n台赌博机,每台赌博机的赢钱概率都不同,但你不知道每台机器的具体赢钱概率。通过一定次数的尝试,找出赢钱概率最高的那台机器,然后将剩下的押注全部放在这台机器上,以此最大化收益。这个问题中的挑战在于找到一个合适的策略,这个策略要在探索(尝试新的机器以了解它们的赢钱概率)和利用(利用已知的信息,押注赢钱概率高的机器)之间找到平衡。贝叶斯思维在这个问题中特别有用。因为每次你尝试一个机器,你就获取了一些新的信息,这个信息可以用来更新你对这台机器赢钱概率的信念。通过不断地更新你的信念,并使用这个信念来指导你的决策,你就能找到一个较好的探索和利用的平衡,从而最大化你的收益。假设你面前有两台赌博机,你先试了第一台几次,发现赢钱的几率不高,然后你就转向第二台机器。第二台机器的前几次试玩,你都赢了,于是你就开始对这台机器有了信心,决定将更多的押注放在这台机器上。但同时,你还会保留一些押注尝试第一台机器,以防万一它的赢钱概率有所改变。这就是在多臂赌博机问题中利用贝叶斯思维的一个简单例子。多臂赌博机问题其实是生活中“探索与开发(exploitation)”权衡的一个模型。这在我们的决策制定,选择策略以及资源分配上都有重要的启示。1、持续学习: 贝叶斯思维鼓励我们积累经验,并根据新信息更新我们的认知。这意味着我们应该不断尝试新的方法,技能和机会,以便获取更多的信息,提高我们做出正确决策的概率。2、决策平衡: 在生活、工作或者投资等多个领域,我们常常需要在已知的有限资源和未知的可能性之间做出权衡。例如,你是否应该留在现在的工作,还是去尝试一份看起来有更多机会的新工作?是否应该投资已经稳定盈利的公司,还是冒险投资一个有巨大增长潜力的创业公司?这都是需要权衡探索与开发的问题。3、风险管理: 多臂赌博机模型还提示我们不能完全忽视任何一个可能的选择,即使它们现在看起来不如其他的选择。这种思维方式有助于我们管理风险,因为我们始终保留了一些资源来对可能性进行探索。4、灵活适应: 贝叶斯思维也教导我们,当环境变化时,我们需要更新我们的预期和决策。这是一种灵活的思维方式,有助于我们在不断变化的世界中保持适应性。所以说,多臂赌博机问题并不仅仅关于赌博,更是一种生活哲学和决策制定策略。我们应有一些自由探索,一些随机漫步,一些闲暇时光。
09
策略九
理解贝叶斯的局限
小心应对黑天鹅事件
当“贝叶斯”遇见“黑天鹅”,会发生什么?
贝叶斯推理是根据新的证据更新信念,而不是推翻旧有的信念。但是,如果旧有的信念是全世界的天鹅都是白的,这时候观察到一只天鹅是黑色的,那么我们难道不应该彻底推翻所有的天鹅都是白的这一信念吗?你看到一只黑天鹅后,贝叶斯推理将你原先的信念"所有的天鹅都是白的"调整为"天鹅可以是白的也可以是黑的"或"大多数天鹅是白色的,但也有一些天鹅是黑色的"。因此,从这个角度来看,你是在用新的证据来调整,而不是完全放弃你的旧信念。然而,特定的信念(如"所有的天鹅都是白的")可以在遇到反例时被彻底推翻。如果我们的决策,我们的下注,建立在类似于"所有的天鹅都是白的"这类信念之上,那么新信息可能就不只是“更新原有信念”,而是彻底摧毁原有信念了。这就是为什么在科学实践中,证伪主义的观点(即,我们应该尝试证伪我们的理论)是非常重要的。所以芒格说,假如你不能比反对者更高明地证伪你的某个观点,你就不配拥有那个观点。由此,我们可以看到,贝叶斯理论虽然强大且实用,但也有其局限性和缺点:1、依赖于先验知识:贝叶斯理论的一个主要缺点是它依赖于先验知识。在许多情况下,这些先验信息可能不准确或者难以获得。例如,一位投资者可能基于错误的信息,或者对市场的错误理解,形成了一个错误的先验信念,这可能导致他们的投资决策出错。2、过于理想化的假设:贝叶斯方法往往假设各个特征是独立的,这在现实中往往不成立。例如,当我们在评估一家公司的股票时,我们可能会考虑这家公司的许多特征,如财务健康状况、市场定位、管理团队等。这些特征之间可能存在着复杂的相互影响关系,而不能简单地视为独立的。3、计算复杂性高:对于复杂的问题,贝叶斯更新可能涉及到大量的计算。如果参数很多或者模型很复杂,那么计算后验概率可能会非常复杂和计算密集。例如,在机器学习中,训练一个贝叶斯网络可能需要大量的计算资源和时间。4、结果可能过于保守:因为贝叶斯更新融合了先验信念和新的观察,所以如果先验信念过于强烈,那么新的观察可能不足以显著改变结果,这可能导致决策过于保守。例如,一个坚定的理想主义者,即使面对了新的证据,也可能坚持他的信念,这可能导致他错过新的机会或者持续在错误的道路上。如本文开篇所言,我探讨的是“可纠错的反馈闭环”和“贝叶斯公式”之间的关系。一个“可纠错的反馈闭环”再强大,也可能掉入局部最优陷阱,或是遭遇“黑天鹅事件”。结局可能就是:一路优秀,99%的时候成功,但却只能是平庸的优秀。又或者,一直很好,但遭遇了极小概率的黑天鹅事件,一击即到,无法翻身。确实,贝叶斯公式和任何概率模型一样,有其局限性,特别是在预测罕见的“黑天鹅”事件时。以下是一些可以尝试的方法,以缓解或避免这些局限性:1、合理选择和更新先验概率:先验概率是贝叶斯推理的关键组成部分,一定要尽可能准确和有信息量。如果先验概率选择不当,可能会导致结果偏离实际。此外,我们必须时刻准备根据新的数据来更新我们的先验概率。2、采用蒙特卡洛模拟法:蒙特卡洛模拟能够帮助我们更好地理解概率分布的全貌,包括那些罕见的事件。通过模拟大量可能的情况,我们可以获得更全面的视角,以期望在遇到“黑天鹅”时,能做出更有准备的响应。3、压力测试和情景分析:尽管贝叶斯推理能够给出一个可能的结果,但我们还需要进行压力测试和情景分析,以确定我们的系统或决策是否能够抵御极端事件的影响。4、注意模型的假设和局限性:任何模型都是基于某些假设的,贝叶斯模型也不例外。我们必须清楚这些假设,并了解在什么情况下,这些假设可能不再适用。当我们注意到模型可能不再适用时,我们就需要寻找其他的方法。5、维持谦逊和开放的心态:面对不确定性,尤其是在面对可能会改变我们的知识或观念的新信息时,保持谦逊和开放的态度是至关重要的。我们需要理解我们的知识和理解都是有限的,永远有学习和改进的空间。这些方法都需要我们理解和接受,无论我们使用什么模型或方法,都不能完全消除不确定性。我们的目标应该是:这个世界上不存在一个万能的公式,给你以所谓100%的确定性。
10
最后
可纠错的反馈闭环
串起人生的项链
可纠错的反馈闭环,对个人而言是非常重要的关键思想。
执行一个动作、观察结果、理解反馈、更新策略、再执行新的动作。在这个过程中,"理解反馈"和"更新策略"的步骤,就是在进行贝叶斯更新。由于时间的推进,在我们的人生当中,每个反馈闭环并不是原地打转,而是犹如链条般串起来。所谓有算法的人生,就是以“可纠错的反馈闭环”为珍珠,串起不断更新、有复利效应的一生。
文章引用微信公众号"袋鼠深度精选",如有侵权,请联系管理员删除!