反饋:能讓你的學習效果更好,也能把你帶到溝裡

天天刷書,一起成長。我們今天繼續看王爍的《三十天認知訓練營第二季》,這講的标題是《選擇:反饋最後會把你帶到陷阱》。

英國哲學家塞亞伯林有個比方,說有兩種人,一種是刺猬,一種是狐狸。

刺猬隻知道一件大事,就一直做這一件事。

狐狸知道很多小事,就會不斷地試。

知道大事的刺猬,大部分都是錯誤的。

總是不斷探索小事一點一點前進的狐狸,可能會獲得最終的勝利。

王爍說,狐狸的勝利在于它在嘗試,并通過反饋的結果,不斷地更換選擇。

反饋在很多的學習方法中,都是重要的一環,比如刻意練習。

從反饋角度來講,可以有三種學習方法。

1// 通過什麼來反饋

想要反饋,先要知道試什麼途徑來獲得反饋。

第一種,就是從自己的經驗反饋中學習。

摸石頭過河,就是從自己的經驗反饋。

每件事做完,對的,就繼續;錯了,就換賽道。

這個反饋最直接,有點像計算機裡的算法。

第二種,模仿别人。

找個對标的對象,他怎麼做,我就怎麼做,copy不走樣。

甚至有些不知道目的的動作也做,因為也不知道到底哪個動作有用。

第三種,進化算法。

進化算法就是模拟自然界的套套邏輯(tautology):适者才能生存,而生存下來的就是适者。自然界就在循環論證。

當然進化中也有沒用的部分,但如果不影響生存,可以完全不care他。

三種方法都重視反饋,根據反饋調整行為,本質上都屬于适應性學習。

但王爍給我們警告,重視反饋要有限度,狐狸也會碰到陷阱。

2// 反饋的陷阱在哪裡

反饋的陷阱在于短視。

我們接受的反饋,都是最直接的結果,而不是很久以後的反饋。

而且,很多學習方法認為,反饋就要及時。

但這種及時就造成了,我們看不到當下行為對長遠的影響。

赢了當下,可能輸了未來。

除了時間,還有一個方面,就是範圍。

我們會更關注局部,但局部最優未必是整體最優。

有時候局部優化會犧牲整體利益。

适應性學習帶來兩大陋習,一個是為了眼前得失犧牲将來,另一個是不肯為了全局犧牲局部。

3// 那該怎麼辦

方法是,去搭刺猬的車。

狐狸和刺猬相比,是短視的,時間上短視,範圍上短視。

但刺猬有長遠計劃,他認準了一件大事,會跨越時間和空間地堅持。

狐狸是一群精緻的利己主義者,最後都會掉入陷阱,沒有出路,所以要搭配刺猬長遠計劃的優點。

但刺猬的成功率非常低,一堆刺猬可能隻有一隻選擇的方向是對的。

那怎麼管理刺猬呢?

能做的是試點。做大事之前先試點,低投入,隔離影響。低投入,所以失敗不會有災難性後果;隔離影響,所以失敗的後果不會傳染全身。

然而,王爍告誡我們,這樣做問題并沒有消失,隻是推到了下一個環節:當試點産生經驗,需要推廣開來時,它會面臨着那堵将特區與整體隔開來的高牆,真正的沖突在那裡等着它。

其實這是個無解的題,我們隻能是找方法做的更好,但逃脫不了最後的命運。

想要現在好,還想要未來好,哪有那麼多的好事。

以上就是今天刷書的主要内容,希望對你有所幫助。

天天刷書,一起成長,明天見。

添加新評論

暱稱
郵箱
網站