[心得] 《雜訊》決策判斷的隱形缺陷和解決方法

作者: wackynoteis (Wacky)   2021-11-08 16:22:13
《雜訊》讀後心得:決策判斷的隱形缺陷和解決方法
諾貝爾獎得主《快思慢想》作者丹尼爾康納曼,醞釀十年的精采之作
圖文好讀 https://readingoutpost.com/noise/
人類做出判斷時的「缺陷」會造成很多不公平的對待。像是不同法官對同一個案件有截然
不同的判決,不同醫師對同一個病人的診斷有很大的差異,不同面試官對同一個求職者的
意見也可能南轅北轍。這些做出判斷的缺陷是怎麼來的?我們可以避免這些缺陷嗎?
這本書在說什麼?
《雜訊》的共同作者是三位知名學者,分別是諾貝爾經濟學獎得主和暢銷書《快思慢想》
的作者丹尼爾.康納曼(Daniel Kahneman)、巴黎商學院的商業政策教授奧利維.席波
尼(Olivier Sibony)、律師暨暢銷書《推出你的影響力》的作者凱斯.桑思汀(Cass
R. Sunstein)。在這本書裡面他們探討一個鮮為人知的現象:「人類只要做出判斷,就
會有雜訊。這些雜訊比我們以為的還多」。
舉凡任何人類做出的決策和判斷,跟正確的答案之間都一定有「誤差」,也就是所謂判斷
的缺陷。誤差則是由偏誤和雜訊兩者的總合。「偏誤」比較廣為人知,例如損失趨避、錨
定效應和從眾效應…等;「雜訊」則不容易被人察覺,像是不同的專家對同一件事情意見
分歧的程度,遠超過人們常理的預測程度。但是,雜訊卻無處不在,影響也不比偏誤小,
只有使用統計學來觀察的時候能讓它現形。
這本書就是一本探討「雜訊」的專書。作者們分析造成雜訊背後的原因,以及雜訊的組成
成份。我們認識雜訊之後,可以採取一些降低雜訊的方法,作者們稱這套方法叫「決策保
健」,用來進一步提升我們做決策判斷時的「準確度」。這些方法將可以帶來更公平的判
決、更精準的預算評估、更有效的人才招募,降低雜訊,就能夠提高我們做決策的品質。
偏誤與雜訊
書中舉了一個很簡單的例子來說明誤差、偏誤、和雜訊這三件事情的關係。你可以想像,
一群人要做出判斷的時候,就像是在「打靶」,他們總是希望打中靶心。而他們真正擊中
的彈痕跟靶心之間的距離,就是「誤差」。這個誤差,代表了他們的做出判斷時的缺陷。
如果把這群人分成四個隊伍,每個隊伍有五個人,同隊的人共用一支步槍,每人射出一發
,最後得到下圖的四種結果。
雜訊和偏誤:https://imgur.com/D1W4KFH
圖片來源:遠見雜誌文章〈康納曼團隊破解決策盲點,「雜訊」才是防疫最大破口?〉
A隊伍,準確。射擊非常準確,全部打在靶心上。這時候,這個隊伍幾乎「沒有誤差」。
B隊伍,有偏誤。五發全部沒有射中靶心,但是五個人的落點都集中在靶紙的左下角。這
時候,表示整個隊伍都有「偏誤」,一起偏向了左下方。
C隊伍,有雜訊。五發的落點都很分散,但是落點平均地分散在靶心的周圍。這時候,表
示這個隊伍充滿了「雜訊」,彼此的方向非常分歧。
D隊伍,有偏誤又有雜訊。五發落點全部偏在左下角,而且非常散亂,這個時候隊伍裡面
既有「偏誤」,又有「雜訊」。
在這本《雜訊》書中重於「雜訊」的討論,也就是隊伍C和D的情形。雖然雜訊和偏誤彼
此是獨立的因素,但是若我們能降低雜訊,就能提升準確度。如果你對於如何降低「偏誤
」有興趣,可以參考作者之一的丹尼爾.康納曼在前一本心理學大作《快思慢想》曾探討
過人類「思考偏誤」的相關問題。
決策判斷的缺陷
總體誤差
這本書以統計學的方式,來描述人類的決策和判斷。舉凡我們做出的判斷有兩種。第一種
是「預測性判斷」,例如一個藥品的藥效、一個選舉的結果,是有標準答案可循的判斷。
第二種是「評估性判斷」,例如歌唱比賽的名次、對罪犯判刑的程度,是沒有標準答案可
循的判斷。
但是,無論是哪一種判斷,我們都會希望不同的人所做出的判斷,其分歧的範圍在一定的
程度之內。如果人們做出的判斷,跟實際的答案或者期望中的答案有差距的時候,這個差
距就被稱為總體誤差(total error)。而造成「總體誤差」的因素就是「偏誤」和「雜
訊」。
人類決策判斷的缺陷 https://imgur.com/ozlnKsm
圖片來源:閱讀前哨站
作者們以統計學的均方差(MSE: mean square error)概念來解釋誤差、偏誤和雜訊三者
之間的關係。他們特別畫直角三角形來示意,是為了解釋一個非常重要的觀念:「誤差之
間不會彼此抵消」。就像是一個保險業承保項目的估價,估價太高,客戶會跑掉;估價太
低,公司會虧錢。因此誤差不論是正、是負,取平方之後就造成了更大的誤差。這些誤差
就是我們最不樂見的。
偏誤:明顯的缺陷
「偏誤」(bias)指的是人們「偏向同一個方向的平均誤差」,也是心理學上面最廣為人
知的研究領域。例如「規劃謬誤」偏誤,就是指人們總是低估完成一件事情所需要的時間
,像是經理人總是低估專案完成的時間。「從眾效應」偏誤,就是指人們傾向相信很多人
相信的事,像是董事會討論一個併購案的時候,董事們會被比較多數人相信的事影響了最
後的決定。從事後諸葛的角度,偏誤很明顯可以用因果的方式來解釋。
雜訊:隱形的缺陷
「雜訊」(noise)指的是人們「彼此判斷的方向不同、意見分歧的程度」,但只有從統
計學的角度才看得到雜訊。像是一般的專業人士,例如經驗資深的保險核保人員,往往對
自己的判斷很有信心,也不會去質疑同事的判斷跟自己有很大的差異。但是一旦把統計的
資料攤在桌上,才會發現這些判斷的差異不但很大,甚至常常有不同的專業人士對同一件
事情有完全相反的判斷。
|在因果關係裡,雜訊不見蹤跡;在統計世界裡,雜訊無所不在。
水準雜訊
雜訊的第一個組成是「水準雜訊」(level),指的是「不同個體平均判斷的差異」,像
是有些法官比較嚴厲,判刑平均都會判比較重;有些法官比較寬容,判刑平均就比較輕。
或者有些股票分析師就是傾向看壞市場,有些分析師則傾向看好市場。
穩定型態雜訊
雜訊的第二個組成是「穩定型態雜訊」(pattern),指的是「判斷者個人的獨特性」,
像是某一位法官對竊案的判刑都很嚴厲,但是他對交通違規的判刑就很寬容。這種穩定型
態不會隨時間改變,代表了同一個判斷者他本身的獨特性,在面對不同類型的案例時,他
所表現出來的差異。
場合雜訊
雜訊的第三個組成是「場合雜訊」(occasion),指的是「跟案例不相干的暫時成分」,
就像是一位醫師在不同日子(天氣、心情)對於同一個診療案件的診斷不同。或者是某一
位法官他支持的球隊昨天獲勝了,所以今天的判刑變得比較寬容。這種雜訊會隨著時間和
場合改變。
|人們認為自己在做判斷時,展現出思考的複雜性,並增添細微的考量。但這種複雜性和
|微妙性只會弄巧成拙,不會提高簡單模型的準確性。
降低雜訊的方法
作者們說:「以總體誤差而言,雜訊和偏誤是互相獨立的。不管偏誤有多少,減少雜訊的
好處都是一樣的。」所以在書中,他們提出了一套叫做「決策保健」的六個步驟,讓我們
可以降低雜訊。這個方法就像洗手一樣,你雖然不容易察覺你避免了什麼細菌(雜訊),
但是等到你被細菌感染之後(造成誤差)才求醫治療就已經太遲。降低雜訊的方法就跟衛
生保健一樣,預防勝於治療。
判斷的目標是準確,而非個人特質的表現。為了避免穩定型態雜訊,讓不同的專業人士對
同一件事情有相近的判斷,我們可以把要判斷的程度先定義清楚,而不是給一張空白畫布
讓人隨意發揮。最激進的做法是利用電腦演算法,以規則來代替判斷,但這個做法的接受
度普遍還不高。
要有統計思維,用外部觀點來看待案件。把我們要判斷的事情,當成是一群類似案件裡面
的其中一個案件,而非每次都把案件當作全新的事件。當我們引入外部的數值,例如評估
一個執行長的留任期間長短,就要先看業界平均期間是多少,再對目前的判斷做出調整。
將判斷結構化,拆解成幾個部分。因為當不同的人看到不同的條件,都會在心裡編織起自
己的故事。就像是不同的面試官可能會給同一個面試者截然不同的評價。這個方式可以打
破人們過度追求連貫性的心理機制,在過程中針對各個獨立的特質進行評分,而不是等到
一連串的評估結束後才一口氣評分做判斷。
抗拒太早出現的直覺。如果我們在第一時間就用直覺來判斷事情,那麼後續我們找的資料
跟佐證,很可能都只是為了證明我們自己的觀點,落入了對自己過度自信的幻覺。好的做
法是延續上一步,把各自獨立的評估都進行完成之後,然後才使用直覺進行最終判斷。
從多位判斷者取得獨立判斷,然後考慮將這些判斷總合起來。作者們透過許多實驗說明,
將獨立的判斷加以平均,可以保證系統雜訊減少。因為不同的判斷者各自的技能和觀點會
互補,增加資料的樣本數可以提高準確性,例如 Google 在招募人才就會參考四位面試者
的判斷。
偏向相對判斷與相對尺度。人類在絕對值上面的判斷,都有各自截然不同的解讀。例如我
們要替一個團隊打績效,不同的主管給每個員工的絕對分數,差異一定很大。但如果改成
用排序的方式,不同的主管給出的排序反而都非常相近。採取案例量表來做判斷,會比給
絕對分數來得好。
綜觀這些方法,我發現跟職場當中一個非常實用的工具「基準比較」(benchmark)有很
強烈的呼應。具體的用法我會在這本書的 Podcast 說書節目的尾聲跟大家詳細分享。
後記:降低影響公平的雜訊
《雜訊》是一本帶給我很多新穎觀念的書,最有趣的就是凸顯了我們常常難以察覺、看似
隱形的雜訊。這本書除了用統計學去說明這個理論之外,也提供了很多法學界、醫界、教
育界、法醫鑑識、職場招募方面的案例,並且提供了一套我們可以應用的方法,來讓我們
降低雜訊,提高做決策的品質。
值得一提的是,這本書打破了我認為只要看「平均值」就好的舊觀念,當雜訊會對判斷的
結果造成極端的影響,就代表了某個人被「不公平對待」了。而這種不公平對待,該檢討
的不是個人,而是個人所身處的「系統」。
如同作者們對於偏誤和雜訊的解讀,兩者之間的差異在於:「偏誤是一個人對件事常有的
各種偏見,犯錯是在個人;而雜訊卻是錯在系統,系統沒有調控機制,導致一群專家,會
針對同一件事,做出截然不同的判斷。」我們只有正視雜訊的存在,致力於改善系統,才
能朝向一個決策更正確、更公平、更健康的社會。
作者: Doralice   2021-11-09 10:13:00
去年的「打開演算法黑箱」對於人類缺陷與如何用演應用算法協作的優缺點描述更為全面,採用的例證也比本書更廣泛有趣。 goodreads的低分相當合理

Links booklink

Contact Us: admin [ a t ] ucptt.com