這裡有人玩 Kaggle 嗎?
其實我還沒認真坐坐下來學Python,也沒其他程式經驗。
只是朋友說Kaggle 很好玩,可以當作學 Python 的目標,建議每兩週作一題,我就挑戰
看看。
我做的是很久的題目,1460 筆房價資料,每筆資料79個特性。
訓練後,要估另外1459筆資料回傳讓網站系統估算成績。
我先花了四五天,整理資料(我以前 Excel 還可以),然後朋友丟一個 Lasso Regressi
on給我,我馬上套用,算一個結果就上傳... 以為這樣就算完成一題。
結果被打搶,Error message 我沒看清楚。
那一版真的很差,預估值誤差 rmse 將近35000。
再花了一週時間,重新再整一次資料,邊研究別人的方法,大致加了兩招:XGB 跟 K fol
d 誤差降低到15000 左右。我想大概是我的極限了。
過程中一直用的 bumpy,pandas,一下子 array, 一下子 dataframe, 花了不少時間處理
,應該乖乖坐下來搞懂才是。