在網路上讀了一天的BTYD package walkthrough已經把大部分的概念都理解了
想問的是裡面有兩個period,分別是calibration(estimation)跟
holdout(validation) period,括號裡面是我爬他的PDF他說普遍的用法
請問這邊的定義是將自己已有的資料拆成estimation跟validation兩個部分
然後用前者去預測後者來評估自己這個模型是否有效嗎?
例如我有2014年到2016年的資料,那我就把2014年到2015年9月的資料設為
estimation period並且預測2015年9月到2016年的值,並且與實際值做比較
來評估此模型的適配度,請問我這個理解是否有錯誤。
第二個問題是裡面有一個fumction可以從原始資料直接轉換成cbs跟cbt
兩個型態,dc.elogtocbscbt這個function他是簡化前面的過程,我先照著
walkthrough走了一遍都沒問題,接著我用這個function來簡化
結果跑出來的t.x值,這個應該是最近一次購買時間到estimation結束時
的差異單位值,我的單位是week,因此值應該是正的1~70左右吧,但是跑出來有兩
千個值左右是負的,想請問為什麼會有負值的情況產生,我設定estimation
為2016-01-01,而validation為2016-03-01,順序應該沒錯,應該不會跑出負的值
請問版上有人有用過這套package來做預測嗎?