反饋：能讓你的學習效果更好，也能把你帶到溝裡

天天刷書，一起成長。我們今天繼續看王爍的《三十天認知訓練營第二季》，這講的标題是《選擇：反饋最後會把你帶到陷阱》。

英國哲學家塞亞伯林有個比方，說有兩種人，一種是刺猬，一種是狐狸。

刺猬隻知道一件大事，就一直做這一件事。

狐狸知道很多小事，就會不斷地試。

知道大事的刺猬，大部分都是錯誤的。

總是不斷探索小事一點一點前進的狐狸，可能會獲得最終的勝利。

王爍說，狐狸的勝利在于它在嘗試，并通過反饋的結果，不斷地更換選擇。

反饋在很多的學習方法中，都是重要的一環，比如刻意練習。

從反饋角度來講，可以有三種學習方法。

1// 通過什麼來反饋

想要反饋，先要知道試什麼途徑來獲得反饋。

第一種，就是從自己的經驗反饋中學習。

摸石頭過河，就是從自己的經驗反饋。

每件事做完，對的，就繼續；錯了，就換賽道。

這個反饋最直接，有點像計算機裡的算法。

第二種，模仿别人。

找個對标的對象，他怎麼做，我就怎麼做，copy不走樣。

甚至有些不知道目的的動作也做，因為也不知道到底哪個動作有用。

第三種，進化算法。

進化算法就是模拟自然界的套套邏輯（tautology）：适者才能生存，而生存下來的就是适者。自然界就在循環論證。

當然進化中也有沒用的部分，但如果不影響生存，可以完全不care他。

三種方法都重視反饋，根據反饋調整行為，本質上都屬于适應性學習。

但王爍給我們警告，重視反饋要有限度，狐狸也會碰到陷阱。

2// 反饋的陷阱在哪裡

反饋的陷阱在于短視。

我們接受的反饋，都是最直接的結果，而不是很久以後的反饋。

而且，很多學習方法認為，反饋就要及時。

但這種及時就造成了，我們看不到當下行為對長遠的影響。

赢了當下，可能輸了未來。

除了時間，還有一個方面，就是範圍。

我們會更關注局部，但局部最優未必是整體最優。

有時候局部優化會犧牲整體利益。

适應性學習帶來兩大陋習，一個是為了眼前得失犧牲将來，另一個是不肯為了全局犧牲局部。

3// 那該怎麼辦

方法是，去搭刺猬的車。

狐狸和刺猬相比，是短視的，時間上短視，範圍上短視。

但刺猬有長遠計劃，他認準了一件大事，會跨越時間和空間地堅持。

狐狸是一群精緻的利己主義者，最後都會掉入陷阱，沒有出路，所以要搭配刺猬長遠計劃的優點。

但刺猬的成功率非常低，一堆刺猬可能隻有一隻選擇的方向是對的。

那怎麼管理刺猬呢？

能做的是試點。做大事之前先試點，低投入，隔離影響。低投入，所以失敗不會有災難性後果；隔離影響，所以失敗的後果不會傳染全身。

然而，王爍告誡我們，這樣做問題并沒有消失，隻是推到了下一個環節：當試點産生經驗，需要推廣開來時，它會面臨着那堵将特區與整體隔開來的高牆，真正的沖突在那裡等着它。

其實這是個無解的題，我們隻能是找方法做的更好，但逃脫不了最後的命運。

想要現在好，還想要未來好，哪有那麼多的好事。

以上就是今天刷書的主要内容，希望對你有所幫助。

天天刷書，一起成長，明天見。