长期主义到底是什么?
似乎没人讲明白。
- 高瓴资本的张磊刚在《价值》一书中讲完长期主义,就被批在新能源汽车的投资上“短期操作”。
- 索罗斯在“活下来”和“投资收益”这方面算是长期主义者,但他是个典型的“反转者”,经常见风使舵。
- 李录被芒格视为“房间里最聪明的人”,是价值投资的信徒,毋庸置疑是位长期主义者,可是他又说投资人应该像个高尔夫球手,应该打无记忆的球。
看起来似乎有点儿矛盾,有点儿分裂。
长期主义不仅很难定义,而且更难实践。
有一次,一位朋友问我:
如何兼顾“长期主义”和“当下行动”呢?
长期主义追求不变,而行动需要随机应变。这二者如何调和呢?
本文将以乔布斯人生中最重要的决策原则为例,用一个独特的“双线模型”,来回答这个问题。
这个“双线模型”,用大白话来说,就是:
永远去做你余生中最重要的那件事。
尽管乔布斯在大家心目中偏“文科”(本人不赞成文理分科),他的这个决策原则似乎也有点儿鸡汤,但事实上,其背后的原理,竟然和AI一模一样。
如我所说:每个高手,都是一只人肉阿尔法狗。
其最大的价值,就是给出了一个每个人都能够实践的“体系”,从而实现:
既能坚持长期主义,又能走好当下一手。
概括而言:
1、长期主义,是指一个人或者机构的长期评估体系,是愿景,价值观,终极目标。
例如对于阿尔法狗而言,其评估体系就是终局胜率。
如此一来,自然就有了大局观。
2、当下一手,就是根据以上评估体系,找出终局胜率最大的一手。
以围棋为例,人类因为算力局限,以及习惯的“只看眼前”,会混淆局部(短期)最优,和全局(长期)最优。
AI就只顾终局胜率,每一手都归零,从头算当下的概率。
为什么要引入概率呢?
因为即使是AI,也无法穷尽变化,精确算出终局胜率,所以干脆用概率评估,选相对优的那一手。
3、以上两点,是长期主义的两只眼。
4、所谓打“无记忆的球”,就是一个马尔可夫决策过程。
马尔可夫过程(马尔可夫链)是一个无记忆的随机过程,看似只管“当前状态”,其实是为了实现全局的期望回报最大化。
5、所以,这就解释了长期主义高手为什么“善变”。
这方面乔布斯做决策和AI下围棋非常像,有时候看起来非常飘忽,会突然放下某个局部不管,走到别处去了,该弃就弃,绝不纠结。
6、长期主义不是简单的“坚持”或“连续”。
一个人的连续性,是根据其对目标的连续性来评估的,而不是看其短期行为的连续性。尽管二者很多时候看起来是一致的。
7、长期主义,还是一个贝叶斯更新的过程。
决策者追求的是大概率靠谱,而不是绝对靠谱,而且这个概率会随着时间不断优化。
长期主义作为一个贝叶斯更新的过程,既是前进,又是进化。
长期主义的本质,是自我的成长。
8、长期主义是对求真的信仰,而对于“眼前一手”,则敢于随时调整自己的信念。
9、只有如此,才可能在一个不确定的世界里,实现时间的复利,空间的复利,资金的复利,以及自我的复利。
10、很多人以为“长期主义”是关于毅力的问题,其实是关于洞察力和计算力的问题。
(以下文字,以前发过一次。)
一
人生会有多个不同意义上的转折点。在经历了多段不靠谱的恋爱之后,花花公子乔布斯终于被收服了,那时他被苹果董事会赶出来5年了,距离他再被请回去复兴这家公司还有6年。
1990年,乔布斯在斯坦福大学做了一次演讲。劳伦·鲍威尔是商学院的新研究生,被一个同学拉来听,因为到晚了,没位置坐,她就带着她的朋友走到第一排,坐在了两个预留的嘉宾位上。
乔布斯到场后,被引导到她旁边的座位。他被右侧劳伦吸引了,和她聊了几句。
乔布斯回忆说:“我在停车场,车钥匙已经插上。我问自己,‘如果这是我人生在世最后一天,我是愿意开一场商业会议,还是同这个女人一起度过?’我跑过停车场,问她是否愿意与我共进晚餐。她说好。我们一起走进市里,自此一生携手。”
后来人们说,劳伦给了世界一个更好的乔布斯。
二
在上面这个爱情传奇里,乔布斯实际上是做了一个思想实验:
他把自己的余生压缩为一天,这样就能更加聚焦地思考,什么是当下最重要的事情。
眼下最优还是长期最优?局部最优还是全局最优?
这可能是牛人和普通人最大的区别之一。
国际象棋天才卡斯帕罗夫说:
“战略家总是先设立一个远期目标,制定相关的战略,然而返回头制定具体措施。他会先设立实现远期目标所必须的一些中期目标。
特级大师下棋时,依靠的不是对成千上万种应对方案进行单纯的筛选,而是先确定一个他想在10-15步棋后希望达到的局面。
他会评估所有可能性,设定一个目标,然后一步步走向这个目标。”
然而人的大脑天生并不是为长期思考做准备的。
我们的大脑是在漫长的进化过程中,靠一点点修修补补完成的,它背负了太多来自远古和丛林时代的包袱。
决定人类思考、计划和决策等理性行为的,是大脑的前额叶皮层,它让我们摆脱了见到老虎就跑的命运,开始有了长期思考的习惯。
三
人工智能击败人类围棋顶尖高手,靠的是长期主义的“战略”,而不是局部精确的“战术”,这一点让人意外。
阿尔法狗之父哈萨比斯认为,关于围棋,人类3000年来犯了一个大错。
围棋里有“金角、银边、草肚皮”的谚语。在过去,人们认为刚开局时,在棋盘的第三路和第四路上落子有更大的价值,太靠近中央则又点儿虚无缥缈。
但是在对战李世石的一局中第37步中,阿尔法狗落子在了第五路,进军棋局的中部区域。与四路相比,这根线离中部区域更近。这可能意味着,在几千年里,人们低估了棋局中部区域的重要性。
为了理解这一点,让我简单重复一下阿尔法狗的工作原理:
1、决策网络:模仿人类,根据“直觉”,找出当下局面最好的5-10种可能的落子点;
2、价值网络:评估上面那几个候选落子点的胜率。是什么胜率?走到终局的胜率。
3、增强学习:人工智能开始的时候“直觉”不会那么准,对胜率的评估也因受到计算深度的控制而未必那么精确,但它可以通过增强学习,进行大量训练,不断进化,进而战胜人类。
这里的要点是:
不管一盘棋多么漫长,阿尔法狗评判一手棋只有一个标准–下到最后的胜率。
人的自我学习和进化,和人工智能非常接近。
如哈萨比斯所说:
从生物角度来讲,动物和人类等,人类的大脑是多巴胺控制的,它在执行增强学习的行为。因此,不论是从数学的角度,还是生物的角度,增强学习是一个有效的解决人工智能问题的工具。
四
冲动是魔鬼,但冲动也实现了地球生物的“自动驾驶”。这是大自然算法的神奇之处,造物主实现这一点,大部分是通过多巴胺。
多巴胺是一种用来帮助细胞传送脉冲的化学物质,是神经传导物质的一种。这种传导物质主要负责大脑的情欲,感觉,将兴奋及开心的信息传递。
简而言之,多巴胺负责即时满足,及时行乐,见了就上,扭头就跑。
后来,人类非常幸运地发展出“前额叶”,从而拥有了“未来”的概念,我们愿意为了将来的目标,抑制当下的冲动。
前额叶如何控制多巴胺?
前额叶像一个大脑中的信息枢纽,当大脑中同时产生了多个与多巴胺相关的信号,这些信号会汇总到前额叶,前额叶像一个评委会主席一样,选出“最美”的那个信号。
选美的标准是什么?就是前额叶对未来的“想象”。假如前额叶觉得某个冲动不利于未来,就会抑制该多巴胺发出的信号。
可想而知,如果与多巴胺相关的活动过于活跃,又或者前额叶并不能对未来有一个明晰的定义以及坚定的执行,那么多巴胺就会占据上风。
五
你也许会说了,谁都知道长期主义好,说到容易做到难啊,为什么成功必须付出“反人性”的代价呢?
再说了,长期主义遥不可及,近期利益就在眼前,中间地带模糊不清,一鸟在手好过百鸟在林啊。
还有,假如饭都吃不饱,谈什么长期主义呢?
卡斯帕罗夫在一次实战中,走出一步算路深达18步的绝杀,震惊棋坛。
我印象中,有次加藤正夫直线进攻,50步毫无差漏,一举绞杀对方大龙,令人赞叹不已。
然而即使如此,绝大多数时候,再厉害的棋手,计算深度也是有限的,更何况坐在对面的,也是旗鼓相当的高手。
人工智能也不能例外,适当的时候必须停止计算。
但即使如此,其评价系统始终如一:
走出当下能赢得全局获胜概率最高的那手棋。
有计划没行动是纸上谈兵,有行动没计划是自寻死路。
爱默生说:“一个人如果懂得如何去作,那么他将永远不会失业。一个人如果懂得为什么去作,那么他将永远是自己的主宰。”
就像大江大河,遇到阻挡,也会绕路,但却始终奔向大海的方向。
没有任何证据显示乔布斯有非常高的智商,相反,他的人格缺陷,让他获得了某种非常决绝的“审判力”,就像一个强大的前额叶。
尽管他本人更像一个多巴胺驱动的人。
纵观苹果的发展历史,那些伟大的产品发明,卓越的商业构想,基本上都是由乔布斯所聚集的聪明人们想出来的。
乔布斯的算法很简单:我只要最好的。
于是他每每做出果断的决策,他够狠心。
塔塔科维尔说:“战术是当你有棋可走时知道如何走棋。战略是当你无棋可走时知道如何走棋。”
在始于上个世纪七十年代的信息浪潮中,乔布斯的偏执构成了一种强大的领导力。
六
然而,长期思维容易让人产生“完美主义”,大事还没有,小事不肯做,四处游离。
解决方案是:专注做好眼下最重要的那件事。
乔布斯的一本个人传记,说到他有个特点:
他会在一段时间对某件事特别专注,然后突然之间,又去关注其他事情。在工作上,他会在想做的时候专注于想做的事情,对其他事他就没反应了,全然不管其他人多么努力地想让他参与进来。
这其实是乔布斯个人算法的另一面:
我只要最好的,我只管把眼前的一件事做到最好。
几乎所有的牛人都有这种瞬间入定的天赋,控制论之父维纳有一天工作回家,竟然没认出在走道等他的女儿。
“史蒂夫会走两个极端,有时高度专注,好像她是宇宙的中心,而有时又表现出冷漠的距离感,专注在工作上。”史密斯说,“他有能力像激光那么专注,当他的光芒照耀在你身上,你会沐浴着他的关爱。而当他的光芒转移到其他关注点时,你就会感觉非常非常的黑暗。这让劳伦感到非常困惑。”
棋手卡帕布兰卡说:
“我只向前看一步,但总是正确的一步。”
七
让我们说回多巴胺和前额叶。
哈佛大学曾有一项研究持续跟踪700多人一生,目的是探寻决定一个人过得幸福的原因到底是什么?
最终的研究结论是:
只有良好的社会关系,包括和谐温暖的亲情、友谊、工作等关系,才能让人们幸福和快乐。
从未有人遗憾地说此生的性爱或蹦极体验不足。一名舒缓疗法护士在病人最后的日子里对其进行了一些调查,向我们展示了人的一生最常见的几大遗憾。位居榜首的是,尤其对于男性,“希望自己工作别那么努力。”
布罗妮·瓦尔是澳大利亚的一名护士,专门照顾生命仅余12周的病人。她将病人弥留之际的顿悟,记录在《人在弥留之际的五大憾事》这本书里。
她所总结的人生五大憾事是:
1、我希望能够有勇气活出真正的自己,而不是按别人的期望生活。
2、我希望自己工作别那么努力。(这一项是男性的憾事之首)
3、我希望能够有勇气表达自己的感受。
4、我希望我能与朋友们保持联系。
5、我希望能让自己更快乐。
在决定去停车场追上劳伦的那一瞬间,乔布斯那个智商并不出色的大脑采用了他一贯擅长的简明算法:把自己的余生压缩到最后一天,我会作何选择?
贝佐斯在决定离开华尔街去创办亚马逊时,也是采用了“最小化后悔模型”。
当我们意识到生命中最重要的是什么时,才能给前额叶发出最清晰的指令,让我们在此起彼伏的多巴胺刺激中,能够做出符合长期利益的决策。
默克尔在哈佛演讲上,给数千位应届毕业生们以肺腑良言:
“常常问自己:我之所以去做,是因为这事本身是对的,还是仅仅因为有把握做成它?”
- 很多时候,我们买某件东西,并非自己真的很需要它,而仅仅是因为打折促销;
- 我们选择做某件事,仅仅是因为短期有满足感,并且甘心因此放弃长期利益;
- 我们做出某个重要决定,并非是因为这个决定正确,而是因为想讨某些人的欢心。
要想为前额叶中建立一个强大的指挥中心,该中心和人工智能一样,只有一个评价标准:让这盘棋的最终获胜概率最大化。
一个人的一生,无非也是一盘棋。
你无需多聪明,也不必多富有,只需像乔布斯们那样:
永远去做你余生中最重要的那件事。
八
扎克伯格每天都问自己这样一个问题:
“我现在做的,是我所能做的最重要的事情吗?只有在获得了肯定的答案后,我才会感到舒服,感觉自己的精力和时间没有白费。”
和乔布斯一样,扎克伯格也擅长贪心算法。
贪心算法,是一种在每一步选择中都采取在当前状态下最好或最优(即最有利)的选择,从而希望导致结果是最好或最优的算法。
贪心算法在有最优子结构的问题中尤为有效。最优子结构的意思是局部最优解能决定全局最优解。简单地说,问题能够分解成子问题来解决,子问题的最优解能递推到最终问题的最优解。
所以,你需要一个分解体系,来链接你的理想和现实。
拷问自己:我现在做的是我所能做的最重要的事情吗?
这是一个不断自我刷新的过程。
大局和局部,坚持和变化,长期和眼前,因为世界的不确定性,因为我们大脑算力的局限性,永远是个难解之题,永远是个从模糊到精确的变化过程。
其实牛人都是善变的,或者说,他们敢于变化。
也许最重要的事情并没有变化,而是经过评估,眼前的这件事情已经与未来最重要的事情不相符了。
又或者,发现此前被设定为最重要的那件事也不对了,勇敢断臂,坚决止损。
永远去做你余生中最重要的那件事,能帮助你持续“自我刷新”。
正如比尔·盖茨在微软CEO纳德拉的个人传记《刷新》的“序言”所说,它(刷新)不会将所有东西都清除并重新开始,它实际上会保留一些内容并替换其他内容。
九
早在认识劳伦之前,乔布斯已经有了一个女儿。
1978年,丽莎出生了,23岁的乔布斯却拒绝承认她是自己的女儿。当时苹果已经上市,在法院的强制下,乔布斯才开始承担部分抚养费。
丽莎9岁时,乔布斯终于承认了丽莎这个女儿,却一直对她尖酸刻薄,以致于女儿10岁时就去看心理医生。
在生命倒数时,这一次不再是一个天才的大脑实验,而是真正的最后时刻,乔布斯终于向丽莎道歉,为自己不陪伴丽莎、忘记她生日、不回信息和电话等等行为道歉,他一遍又一遍地对丽莎说:“我欠你个人情。”
他最终留给了丽莎和其他子女相同数额的遗产。
他说:“如果时光可以倒流,我希望我能是个更好的爸爸。”
温哥华有个朋友,去参加孩子升入高中后的家长会,她以为会是类似于我们的高考总动员什么的,结果校长在发言中只强调了一点:
“你们的孩子马上就要长大成人,这几年会是你和他最宝贵的相处时光,好好享受。”
去年(2018年)在香港,遇到一位此前在地产行业有过交往的朋友,他好心地帮我算了一下过去10年我因为移居异国而可能少赚的钱。
“你后悔吗?”他问。
坦率地说,我从未有过一秒的后悔。
因为我没错过孩子长大的岁月。
即使想赚更多钱,也可早可晚。
而孩子的成长是不可逆的。
我很庆幸自己,当初选择了做余生中最重要的那件事。
孤独大脑 2021-02-23 09:06
0