※ 引述 《sustainer123 (溫水佳樹的兄長大人)》 之銘言:
: 推 cities516: k-fold不如直接全部丟進去train 12/10 17:14
: → cities516: 除非你很肯定某部分資料是dirty data 對訓練有害 12/10 17:15
: → cities516: 才用k-fold去驗證 12/10 17:15
仔細想了一下
k-fold跟holdout最大差別就是能不能充分用到所有數據
但k-fold需要的時間是holdout的k倍
假設資料集超小 holdout隨便抽有可能抽到超偏頗樣本
所以k-fold這時候就很有用
假設資料集超大 k-fold就要花太多時間
而且樣本集夠大 正常劃分應該不太會分得太偏頗
這樣?