來源:孤獨大腦
長期主義到底是什麽?
似乎沒人講明白。
高瓴資本的張磊剛在《價值》一書中講完長期主義,就被批在新能源汽車的投資上“短期操作”。
索羅斯在“活下來”和“投資收益”這方面算是長期主義者,但他是個典型的“反轉者”,經常見風使舵。
李錄被芒格視為“房間里最聰明的人”,是價值投資的信徒,毋庸置疑是位長期主義者,可是他又說投資人應該像個高爾夫球手,應該打無記憶的球。
看起來似乎有點兒矛盾,有點兒分裂。
長期主義不僅很難定義,而且更難實踐。
有一次,一位朋友問我:
如何兼顧“長期主義”和“當下行動”呢?
長期主義追求不變,而行動需要隨機應變。這二者如何調和呢?
本文將以喬布斯人生中最重要的決策原則為例,用一個獨特的“雙線模型”,來回答這個問題。
這個“雙線模型”,用大白話來說,就是:
永遠去做你餘生中最重要的那件事。
盡管喬布斯在大家心目中偏“文科”(本人不讚成文理分科),他的這個決策原則似乎也有點兒雞湯,但事實上,其背後的原理,竟然和AI一模一樣。
如我所說:每個高手,都是一只人肉阿爾法狗。
其最大的價值,就是給出了一個每個人都能夠實踐的“體系”,從而實現:
既能堅持長期主義,又能走好當下一手。
概括而言:
1. 長期主義,是指一個人或者機構的長期評估體系,是願景,價值觀,終極目標。
例如對於阿爾法狗而言,其評估體系就是終局勝率。
如此一來,自然就有了大局觀。
2. 當下一手,就是根據以上評估體系,找出終局勝率最大的一手。
以圍棋為例,人類因為算力局限,以及習慣的“只看眼前”,會混淆局部(短期)最優,和全局(長期)最優。
AI就只顧終局勝率,每一手都歸零,從頭算當下的概率。
為什麽要引入概率呢?
因為即使是AI,也無法窮盡變化,精確算出終局勝率,所以幹脆用概率評估,選相對優的那一手。
3. 以上兩點,是長期主義的兩只眼。
4. 所謂打“無記憶的球”,就是一個馬爾可夫決策過程。
馬爾可夫過程(馬爾可夫鏈)是一個無記憶的隨機過程,看似只管“當前狀態”,其實是為了實現全局的期望回報最大化。
5. 所以,這就解釋了長期主義高手為什麽“善變”。
這方面喬布斯做決策和AI下圍棋非常像,有時候看起來非常飄忽,會突然放下某個局部不管,走到別處去了,該棄就棄,絕不糾結。
6. 長期主義不是簡單的“堅持”或“連續”。
一個人的連續性,是根據其對目標的連續性來評估的,而不是看其短期行為的連續性。盡管二者很多時候看起來是一致的。
7. 長期主義,還是一個貝葉斯更新的過程。
決策者追求的是大概率靠譜,而不是絕對靠譜,而且這個概率會隨著時間不斷優化。
長期主義作為一個貝葉斯更新的過程,既是前進,又是進化。
長期主義的本質,是自我的成長。
8. 長期主義是對求真的信仰,而對於“眼前一手”,則敢於隨時調整自己的信念。
9. 只有如此,才可能在一個不確定的世界里,實現時間的復利,空間的復利,資金的復利,以及自我的復利。
10. 很多人以為“長期主義”是關於毅力的問題,其實是關於洞察力和計算力的問題。
一
人生會有多個不同意義上的轉折點。在經歷了多段不靠譜的戀愛之後,花花公子喬布斯終於被收服了,那時他被蘋果董事會趕出來5年了,距離他再被請回去復興這家公司還有6年。
1990年,喬布斯在斯坦福大學做了一次演講。勞倫·鮑威爾是商學院的新研究生,被一個同學拉來聽,因為到晚了,沒位置坐,她就帶著她的朋友走到第一排,坐在了兩個預留的嘉賓位上。
喬布斯到場後,被引導到她旁邊的座位。他被右側勞倫吸引了,和她聊了幾句。
喬布斯回憶說:“我在停車場,車鑰匙已經插上。我問自己,‘如果這是我人生在世最後一天,我是願意開一場商業會議,還是同這個女人一起度過?’我跑過停車場,問她是否願意與我共進晚餐。她說好。我們一起走進市里,自此一生攜手。”

後來人們說,勞倫給了世界一個更好的喬布斯。
二
在上面這個愛情傳奇里,喬布斯實際上是做了一個思想實驗:
他把自己的餘生壓縮為一天,這樣就能更加聚焦地思考,什麽是當下最重要的事情。
眼下最優還是長期最優?局部最優還是全局最優?
這可能是牛人和普通人最大的區別之一。
國際象棋天才卡斯帕羅夫說:
“戰略家總是先設立一個遠期目標,製定相關的戰略,然而返回頭製定具體措施。他會先設立實現遠期目標所必須的一些中期目標。
特級大師下棋時,依靠的不是對成千上萬種應對方案進行單純的篩選,而是先確定一個他想在10-15步棋後希望達到的局面。
他會評估所有可能性,設定一個目標,然後一步步走向這個目標。”
然而人的大腦天生並不是為長期思考做準備的。
我們的大腦是在漫長的進化過程中,靠一點點修修補補完成的,它背負了太多來自遠古和叢林時代的包袱。
決定人類思考、計劃和決策等理性行為的,是大腦的前額葉皮層,它讓我們擺脫了見到老虎就跑的命運,開始有了長期思考的習慣。
三
人工智能擊敗人類圍棋頂尖高手,靠的是長期主義的“戰略”,而不是局部精確的“戰術”,這一點讓人意外。
阿爾法狗之父哈薩比斯認為,關於圍棋,人類3000年來犯了一個大錯。
圍棋里有“金角、銀邊、草肚皮”的諺語。在過去,人們認為剛開局時,在棋盤的第三路和第四路上落子有更大的價值,太靠近中央則又點兒虛無縹緲。
但是在對戰李世石的一局中第37步中,阿爾法狗落子在了第五路,進軍棋局的中部區域。與四路相比,這根線離中部區域更近。這可能意味著,在幾千年里,人們低估了棋局中部區域的重要性。
為了理解這一點,讓我簡單重復一下阿爾法狗的工作原理:
1. 決策網絡:模仿人類,根據“直覺”,找出當下局面最好的5-10種可能的落子點。
2. 價值網絡:評估上面那幾個候選落子點的勝率。是什麽勝率?走到終局的勝率。
3. 增強學習:人工智能開始的時候“直覺”不會那麽準,對勝率的評估也因受到計算深度的控製而未必那麽精確,但它可以通過增強學習,進行大量訓練,不斷進化,進而戰勝人類。
這里的要點是:
不管一盤棋多麽漫長,阿爾法狗評判一手棋只有一個標準——下到最後的勝率。
人的自我學習和進化,和人工智能非常接近。
如哈薩比斯所說:
從生物角度來講,動物和人類等,人類的大腦是多巴胺控製的,它在執行增強學習的行為。因此,不論是從數學的角度,還是生物的角度,增強學習是一個有效的解決人工智能問題的工具。
四
衝動是魔鬼,但衝動也實現了地球生物的“自動駕駛”。這是大自然算法的神奇之處,造物主實現這一點,大部分是通過多巴胺。
多巴胺是一種用來幫助細胞傳送脈衝的化學物質,是神經傳導物質的一種。這種傳導物質主要負責大腦的情欲,感覺,將興奮及開心的信息傳遞。
簡而言之,多巴胺負責即時滿足,及時行樂,見了就上,扭頭就跑。
後來,人類非常幸運地發展出“前額葉”,從而擁有了“未來”的概念,我們願意為了將來的目標,抑製當下的衝動。

前額葉如何控製多巴胺?
前額葉像一個大腦中的信息樞紐,當大腦中同時產生了多個與多巴胺相關的信號,這些信號會匯總到前額葉,前額葉像一個評委會主席一樣,選出“最美”的那個信號。
選美的標準是什麽?就是前額葉對未來的“想象”。假如前額葉覺得某個衝動不利於未來,就會抑製該多巴胺發出的信號。
可想而知,如果與多巴胺相關的活動過於活躍,又或者前額葉並不能對未來有一個明晰的定義以及堅定的執行,那麽多巴胺就會占據上風。
五
你也許會說了,誰都知道長期主義好,說到容易做到難啊,為什麽成功必須付出“反人性”的代價呢?
再說了,長期主義遙不可及,近期利益就在眼前,中間地帶模糊不清,一鳥在手好過百鳥在林啊。
還有,假如飯都吃不飽,談什麽長期主義呢?
卡斯帕羅夫在一次實戰中,走出一步算路深達18步的絕殺,震驚棋壇。
我印象中,有次加藤正夫直線進攻,50步毫無差漏,一舉絞殺對方大龍,令人讚歎不已。
然而即使如此,絕大多數時候,再厲害的棋手,計算深度也是有限的,更何況坐在對面的,也是旗鼓相當的高手。
人工智能也不能例外,適當的時候必須停止計算。
但即使如此,其評價系統始終如一:
走出當下能贏得全局獲勝概率最高的那手棋。
有計劃沒行動是紙上談兵,有行動沒計劃是自尋死路。
愛默生說:“一個人如果懂得如何去工作,那麽他將永遠不會失業。一個人如果懂得為什麽去工作,那麽他將永遠是自己的主宰。”
就像大江大河,遇到阻擋,也會繞路,但卻始終奔向大海的方向。
沒有任何證據顯示喬布斯有非常高的智商,相反,他的人格缺陷,讓他獲得了某種非常決絕的“審判力”,就像一個強大的前額葉。
盡管他本人更像一個多巴胺驅動的人。
縱觀蘋果的發展歷史,那些偉大的產品發明,卓越的商業構想,基本上都是由喬布斯所聚集的聰明人們想出來的。
喬布斯的算法很簡單:我只要最好的。
於是他每每做出果斷的決策,他夠狠心。
塔塔科維爾說:“戰術是當你有棋可走時知道如何走棋。戰略是當你無棋可走時知道如何走棋。”
在始於上個世紀七十年代的信息浪潮中,喬布斯的偏執構成了一種強大的領導力。
六
然而,長期思維容易讓人產生“完美主義”,大事還沒有,小事不肯做,四處遊離。
解決方案是:專注做好眼下最重要的那件事。
喬布斯的一本個人傳記,說到他有個特點:
他會在一段時間對某件事特別專注,然後突然之間,又去關注其他事情。在工作上,他會在想做的時候專注於想做的事情,對其他事他就沒反應了,全然不管其他人多麽努力地想讓他參與進來。
這其實是喬布斯個人算法的另一面:
我只要最好的,我只管把眼前的一件事做到最好。
幾乎所有的牛人都有這種瞬間入定的天賦,控製論之父維納有一天工作回家,竟然沒認出在走道等他的女兒。

“史蒂夫會走兩個極端,有時高度專注,好像她是宇宙的中心,而有時又表現出冷漠的距離感,專注在工作上。”史密斯說,
“他有能力像激光那麽專注,當他的光芒照耀在你身上,你會沐浴著他的關愛。而當他的光芒轉移到其他關注點時,你就會感覺非常非常的黑暗。這讓勞倫感到非常困惑。”
棋手卡帕布蘭卡說:“我只向前看一步,但總是正確的一步。”
七
讓我們說回多巴胺和前額葉。
哈佛大學曾有一項研究持續跟蹤700多人一生,目的是探尋決定一個人過得幸福的原因到底是什麽?
最終的研究結論是:
只有良好的社會關系,包括和諧溫暖的親情、友誼、工作等關系,才能讓人們幸福和快樂。
從未有人遺憾地說此生的性愛或蹦極體驗不足。一名舒緩療法護士在病人最後的日子里對其進行了一些調查,向我們展示了人的一生最常見的幾大遺憾。位居榜首的是,尤其對於男性,“希望自己工作別那麽努力。”
布羅妮·瓦爾是澳大利亞的一名護士,專門照顧生命僅餘12周的病人。她將病人彌留之際的頓悟,記錄在《人在彌留之際的五大憾事》這本書里。
她所總結的人生五大憾事是:
1. 我希望能夠有勇氣活出真正的自己,而不是按別人的期望生活。
2. 我希望自己工作別那麽努力。(這一項是男性的憾事之首)
3. 我希望能夠有勇氣表達自己的感受。
4. 我希望我能與朋友們保持聯系。
5. 我希望能讓自己更快樂。
在決定去停車場追上勞倫的那一瞬間,喬布斯那個智商並不出色的大腦采用了他一貫擅長的簡明算法:把自己的餘生壓縮到最後一天,我會作何選擇?
貝佐斯在決定離開華爾街去創辦亞馬遜時,也是采用了“最小化後悔模型”。
當我們意識到生命中最重要的是什麽時,才能給前額葉發出最清晰的指令,讓我們在此起彼伏的多巴胺刺激中,能夠做出符合長期利益的決策。
默克爾在哈佛演講上,給數千位應屆畢業生們以肺腑良言:
“常常問自己:我之所以去做,是因為這事本身是對的,還是僅僅因為有把握做成它?”
很多時候,我們買某件東西,並非自己真的很需要它,而僅僅是因為打折促銷。
我們選擇做某件事,僅僅是因為短期有滿足感,並且甘心因此放棄長期利益。
我們做出某個重要決定,並非是因為這個決定正確,而是因為想討某些人的歡心。

要想為前額葉中建立一個強大的指揮中心,該中心和人工智能一樣,只有一個評價標準:讓這盤棋的最終獲勝概率最大化。
一個人的一生,無非也是一盤棋。
你無需多聰明,也不必多富有,只需像喬布斯們那樣:
永遠去做你餘生中最重要的那件事。
八
紮克伯格每天都問自己這樣一個問題:
“我現在做的,是我所能做的最重要的事情嗎?只有在獲得了肯定的答案後,我才會感到舒服,感覺自己的精力和時間沒有白費。”
和喬布斯一樣,紮克伯格也擅長貪心算法。
貪心算法,是一種在每一步選擇中都采取在當前狀態下最好或最優(即最有利)的選擇,從而希望導致結果是最好或最優的算法。
貪心算法在有最優子結構的問題中尤為有效。最優子結構的意思是局部最優解能決定全局最優解。簡單地說,問題能夠分解成子問題來解決,子問題的最優解能遞推到最終問題的最優解。
所以,你需要一個分解體系,來鏈接你的理想和現實。
拷問自己:我現在做的是我所能做的最重要的事情嗎?
這是一個不斷自我刷新的過程。

大局和局部,堅持和變化,長期和眼前,因為世界的不確定性,因為我們大腦算力的局限性,永遠是個難解之題,永遠是個從模糊到精確的變化過程。
其實牛人都是善變的,或者說,他們敢於變化。
也許最重要的事情並沒有變化,而是經過評估,眼前的這件事情已經與未來最重要的事情不相符了。
又或者,發現此前被設定為最重要的那件事也不對了,勇敢斷臂,堅決止損。
永遠去做你餘生中最重要的那件事,能幫助你持續“自我刷新”。
正如比爾·蓋茨在微軟CEO納德拉的個人傳記《刷新》的“序言”所說,它(刷新)不會將所有東西都清除並重新開始,它實際上會保留一些內容並替換其他內容。
九
早在認識勞倫之前,喬布斯已經有了一個女兒。
1978年,麗莎出生了,23歲的喬布斯卻拒絕承認她是自己的女兒。當時蘋果已經上市,在法院的強製下,喬布斯才開始承擔部分撫養費。
麗莎9歲時,喬布斯終於承認了麗莎這個女兒,卻一直對她尖酸刻薄,以致於女兒10歲時就去看心理醫生。
在生命倒數時,這一次不再是一個天才的大腦實驗,而是真正的最後時刻,喬布斯終於向麗莎道歉,為自己不陪伴麗莎、忘記她生日、不回信息和電話等等行為道歉,他一遍又一遍地對麗莎說:“我欠你個人情。”
他最終留給了麗莎和其他子女相同數額的遺產。
他說:“如果時光可以倒流,我希望我能是個更好的爸爸。”

溫哥華有個朋友,去參加孩子升入高中後的家長會,她以為會是類似於我們的高考總動員什麽的,結果校長在發言中只強調了一點:“你們的孩子馬上就要長大成人,這幾年會是你和他最寶貴的相處時光,好好享受。”
去年(2018年)在香港,遇到一位此前在地產行業有過交往的朋友,他好心地幫我算了一下過去10年我因為移居異國而可能少賺的錢。
“你後悔嗎?”他問。
坦率地說,我從未有過一秒的後悔。
因為我沒錯過孩子長大的歲月。
即使想賺更多錢,也可早可晚。
而孩子的成長是不可逆的。
我很慶幸自己,當初選擇了做餘生中最重要的那件事。
編輯/lambor