我不是很懂大數據但有實際操作過,地政才丟20萬筆就想搞大數據是想的太美好,我丟過
30萬筆資料出來的結果,沒比我自己寫excel去跑優而且差很多。
所謂大數據這東西是這樣,通常是廠商建個模型,然後你要丟一些東西去train他,告訴
他出來的東西對不對,你只能知道結果對或錯,但他不會跟你說他怎麼運算的,因為太複
雜,他會根據你的回饋去修正判斷標準,讓判斷越來越準確,理論上他是一種AI學習結果
。
到這裡有兩個重點,第一你模型怎麼建的?鬼才知道,第二個非常重要你要train的好電
腦才會準,這是非常大工程累死人還不一定有好結果。
理論上應該會越來越準確,但實際沒那麼準時你根本無法知道為什麼,只能再train再看
,假如你有無限資料無限時間可以把系統搞好,可惜通常你時間有限,你的工作更不會只
有整天在train這不知什麼鬼的東西。
應用在實價登錄我第一個想到的就是他原始資料夠不夠多,關鍵不是20萬筆登錄,是以往
地政抓了幾個不實申報,你抓的不夠多等於能train的很少,整個模型一定不準,說是AI
但同時也是很靠人為的東西。
再來就是你用大數據抓了一些高風險案例,重點是之後呢?地政是公家機關要依法行政,
不能抓了就說你有罪,當然還是要調查,其實後段都是一樣的。