: 數據不是愈多愈好,這部分其實我本來想表示的是過多的資訊可能會讓我們迷失原本的目
: 標。可能你本來想要查詢什麼東西,結果查一查後來就把焦點放在其它的事物上,導致我
: 們原本想要查詢的問題沒有獲得解答。有時候某些資訊可以提供有效的論點時,我們就不
: 一定要獲取更多的資訊,當然多方查詢並非一件壞事啦,尤其是要做什麼重大決策時。只
: 是不要忘記我們查詢的目的是什麼? 主要是為了解決問題,或者滿足求知慾,或者只是純
: 粹無聊,或者只是想要告解、紓解壓力,或者只是要寫作業報告…等等。
: 變數不是愈多愈好,這部分其實是要找某些因素之間的相關性或因果關係。如果你的變數
: 有很多,可能會湊巧找到一個變數剛好具有相關性,如果你以為已經找到解答的話,可能
: 就會陷入思維的陷阱。作者也提供一個例子,也就是基因學家在尋找DNA序列什麼會跟什
: 麼有關係時,有時候會發現什麼會跟什麼有關係,然後他們就很開心發表這個重大發現,
: 如果事後能夠證實的話,也許可以撈到一個諾貝爾獎,不過常常發生的情況是事後進行其
: 它數據集的研究時,反而推翻他們原先的發現。科學研究就是這個樣子,如果你不能夠在
: 其它地方重複驗證這樣的相關性或因果關係,那麼你就不能夠聲稱自己找到什麼重大發現
: 。也許之前南韓聲稱找到常溫超導體,也是陷入了這樣的一個陷阱。你看像物理學、生物
: 學或化學這樣嚴謹的科學領域都有可能會犯這種思考陷阱了,更不用說在經濟學、政治學
: 、社會學這些難以論證的領域,有多少人會犯這樣的錯誤了。
: 有空再打。
這本書雖然好像揭露許多人性的醜陋面,例如性傾向、暴力傾向、種族歧視、性別歧視等
等,這些研究結果是根據Google搜尋、FB或其它社群網路的行為等等所得到的結論。不過
如前所述有相關性不一定會有因果關係,像作者說川普之前會勝選是因為種族歧視的關係
,他還特定提供川普各州得票率和種族歧視之間的相關性,看起來好像有相關,不過也不
能說明川普後來為什麼會輸給拜登。難到是這期間各州的種族歧視狀況有變化嗎? 想來好
像也不是這麼一回事。而且今年的美國大選結果會如何還很難說,難道又跟種族歧視有關
? 我想應該跟多因素有關,所以單用大數據做出某些因素之間的相關性,可能也不能說明
什麼。
所以這樣的大數據分析還有用嗎? 不知道,不過應該得到不少有用的資訊,至少企業可以
從中獲取更多的利益,也就是未來這種大數據分析或資料探勘的研究還是會繼續下去,因
為現實世界很複雜,很多社會現象我們很難找到原因,透過大數據分析、人工智慧或者其
它工具,我們可以更瞭解人類彼此之間是如何互動的,這個社會和世界是如何運轉的。一
切都是為了讓我們解決問題、改善我們的生活、得到更大的利益或者永續發展做努力。
但這不意味味傳統調查方式就完全沒什麼用處,也許可以和大數據分析做互補的動作,這
是因為也許大數據分析有其不足之處,或者目前的技術還無法臻於完美,所以我們需要各
種資料蒐集方式,各種處理或分析資料的方式,各種工具或資源的運用,讓我們能夠更準
確掌握我們觀察到的現象,並且可能的話,更準確地去預測未來,更準確地去迴避一些風
險。雖然未來存在著許多未知數,但是掌握更多的情報,就比較能夠掌握好未來。缺乏情
報就涉足冒險是相當危險的事情,雖然不敢冒險是最大的風險,但是有勇無謀的行為很容
易會造成嚴重的後果。(謎: 有時候就是沒有足夠情報還是必須做出選擇啊!!! 有那麼容易
就能預測未來的話大家就不用煩惱了。)
奇怪我在打什麼東西,好像愈扯愈遠了,好了不打了,這次的心得就這樣吧。
https://i.imgur.com/O6ycBYJ.jpg