上禮拜去逛SOGO和誠品敦南店, 買了兩本書:
https://i.imgur.com/Vuo7vLM.jpg
今天要介紹的是
數據、謊言與真相 作者為Seth Stephens-Davidowitz
作者是哈佛大學經濟博士
本書我蠻感興趣的是因為他使用了很多"誠實"的數據
並非矯揉造作或透過大學生的眼光去看得數據
例如:
很多"行人"在google上的搜尋 會是penistrain 而不是pedestrian
"廚師"會被搜尋成"cock" 而不是cook
人的搜尋行為不會說謊 但是key錯字會說謊
另外作者賽斯博士也引述了很多google上的數字和大數據去處理現有的資訊
例如: 當歐巴馬要去中東演說時 就會出現很多恐怖攻擊以及恐怖份子的搜尋關鍵字
當一個浪潮襲來時 真的會發生
套一句大學時代鄭老師的話說 謊話說了70次可能不會成真 但說了1000次就成真了
這是一種"風潮"(trend)
作者也說道當女人對眼前的約會對象有興趣時 她的性感字眼可能是"我"
因為她對他有興趣 感到自在 就會一直滔滔不絕說自己
假如約會時都是問問題 那就是不感興趣才會有的疑問 沒話說了 只好問問題
女性比男性更常談論"購物"和"我的頭髮";男人比女人更常談論"足球"和"Xbox"
許多數字是trash in trash out
不一定量大的數字才是正確性高 精準度高的預測成果
而是"質地精美"的數據 才具有代表性以及高預測性
作者引用米蘭昆德拉在小說"生命中不能承受之輕"的令人感歎的話:
"人的生命只有一次,我們永遠無法檢證哪一個決定是好的,哪一個決定是壞的,
因為在所有的處境裡,決定的機會都只有一次,我們沒有第二次、第三次、第四次
的生命,可以比較不同的決定。"
另外 大數據也有道德危險 例如某企業要雇用某一人 會去搜尋他的臉書 社群訊息
以及所有網路上的代表性資訊 或按讚次數 也許當此人說了某公司的壞話 可以不錄取他
這沒有道德危險 但假如發現了一項非關重要性的數據 因而不去錄用他
這就是道德危險
因為人不知道自己的言論在大數據上呈現的歸類在哪一類?
是智商低、而不能得到他所稱職的工作?
這似乎太不公平了
書中結尾也提到 無論在任何情況下 我們必須追蹤大數據的線索
如果有統計技能的人 也富有一些創造人 歡迎來從事數據分析的工作
我覺得這本書可以一氣呵成 蠻好看的
推薦給您