[心得] 用FB Prophet預測美股未來行情

作者: zmcx16 (zmcx16)   2021-11-27 21:19:32
完整文章:
https://blog.zmcx16.moe/2021/11/fb-prophet.html
Github程式碼:
https://github.com/zmcx16/stock-forecast
最近覺得自己美股轉換標的的時機都不是很好, 抄底常抄在半山腰, 就想說來研究一下預
測趨勢好了, 雖然知道要預測市場趨勢基本上不可能, 變因變數太多, 不過就當作小參考
也好, 至少能大概知道從過去來看目前大致的趨勢是向上或向下也不錯~。
Note:
以下的內容只是實驗用, 行情預測要考慮的變因變數太多, 也沒有絕對永遠適用的方法,
建議把以下內容當做一種類似均線的參考就好。
FB Prophet時序模型公式:
y(t) = g(t) + s(t) + h(t) + e(t)
g(t) 代表趨勢,直接透過線性模型來回歸出大致上的趨勢
s(t) 代表週期的變化,日週期,週週期,年週期等
h(t) 代表假日的變化,假日週期可能會影響到持有股價的意願。
e(t) 包含了模型沒有涵蓋的錯誤或者是變化
從公式看可以知道主要是以趨勢跟週期的變化去擬合未來的預測結果。 基本上單針對行
情預測這件事來說, 最重要的就是趨勢的預測, 年週期的部分則是對淡旺季有所幫助, 節
假日的部分或許也或多或少有幫助 (e.g. 感恩節, 黑色星期五等?)。
接著就來測試看看模型的效果如何, 測試資料就先選AT&T的近一年股價資料, 首先把近一
年的資料拆成9:1, 前10.8個月當訓練資料, 後1.2個月當測試資料, 再來評估模型的效
果:
https://i.imgur.com/7SssPt4.png
上面黑色的點是真實資料的點價位, 藍色的線則是模型訓練完後模擬出的結果, 淺藍色的
區塊則是預測線的上限及下限, 可以當成模型認為可能的最大誤差, 至於Y軸的值為什麼
跟股價不一樣, 是因為有先對資料做對數轉換, 把資料變得更平穩並且預測的趨勢能更趨
於線性。
https://i.imgur.com/hbIMXHK.png
第二張圖則是Prophet其他component的圖, 上面那張是趨勢預測圖, 基本上前大半部分會
跟這一年的股價差不多擬合, 而最後面那一段有淡藍色區塊的則是實際預測的部分。 而
下面那張圖是用每週循環的預測, 基本上意義不大就不看了~。
https://i.imgur.com/vusifta.png
最後第三張圖則是在把資料做對數反轉換, 還原回原本的股價資料, 光從AT&T本身的股價
趨勢就覺得會繼續往下跌, 模型預測出的結果也就是符合他近期的下跌趨勢, 在加一些怪
怪的小循環震盪...。
比較有意思的地方是, 預測的股價下限趨勢差不多是維持一樣的斜率, 可是上限則是往上
持平, 應該可以想成模型認為股價之後可能會繼續用差不多的速度往下跌, 或是轉為盤整
趨勢。 再來最後我們可以用測試資料跟預測資料算一下平均誤差跟均方誤差:
MSE: 1.2798056068411054
MAE: 1.0764610288441487
單純用平均誤差看, 跟真實股價平均差一塊錢左右, 以25塊的股價算差不多是4%, 1.8個
月的預測資料跟真實資料落差4%價格, 這樣的結果是好或不好, 其實我也不太能把握, 畢
竟AT&T的beta本來就小, 如果是波動大的個股, 只落差4%的話我是會覺得很厲害...。
跑完上面的模型, 在來重新思考一下, 上面的模型只是單純用近10.2個月的收盤價, 去預
測後面1.8個月的收盤價, 就只是個單變數的模型, 可是股票市場的變數何其多, 單用收
盤價就去預測未來資訊太少了, 能準確預測反而才奇怪。
關於這點, Prophet本身是可以接受添加附加的回歸量來訓練模型的, 只不過必須在訓練
資料跟預測資料上都有想加的回歸量才行, 可是未來的資料不可能會有, 只能用某些方法
才能生成出來。 這邊選的簡單作法就是, 先把你想加的回歸量都做一遍預測, 然後拿這
些預測的回歸量當作你真正要預測的模型的附加回歸量, 這樣就可以只依靠訓練資料做多
變數預測模型了, 在這邊我額外加入了Open High Low Volume作為附加的回歸量, 並來預
測未來收盤價的結果:
https://i.imgur.com/YBnW6CM.png
https://i.imgur.com/8TE693C.png
https://i.imgur.com/K6jYUiR.png
恩....看第一張圖跟第三張圖, 可以發現預測線跟上下限極度貼合實際的股價, 其實這結
果不太意外, 因為附加的回歸量有開盤價跟最高價以及最低價, 而這三種資料跟收盤價本
來就是極度相近的, 所以畫出來會長這樣我倒是不太意外...。
再來看最後一段預測的結果, 趨勢來說還是一樣的, 只是上下限的部分也極度貼合, 這通
常就兩種情況, 一是真的精準度很高, 預測神準, 不過想也知道不太可能; 而第二種情況
是最有可能的, 就是overfitting過度學習了, 來看看最終測試資料的平均誤差跟均方誤
差結果:
MSE: 1.1426736398003121
MAE: 0.9865404828745983
結果還真的比只用收盤價的模型好了近10%, 我是覺得只是運氣好啦... 關於這個問題就
先放一邊, 因為上面的預測模型看起來就太overfitting了, 這次附加回歸量我去掉Open
High Low, 只用Volume試試看, 因為Volume本身跟價格無關, 應該不會在有上面那種極度
擬合的預測圖, 下面是跑完的結果:
https://i.imgur.com/R2grNEn.png
https://i.imgur.com/I4tQS7L.png
https://i.imgur.com/aEZVm04.png
MSE: 1.3153719245816298
MAE: 1.0991889378931168
看起來跟只用收盤價預測差不多, 不過均方差跟平均差反而更大了, 其實要說不意外也是
不意外, 畢竟交易量大增有可能大漲也有可能大跌, 至於到底往上走還是往下走都是概率
的問題, 猜錯方向就是大錯...。
上面部落格完整文章另外有用AAPL實驗的結果, 礙於篇幅就不寫在這了, 有興趣的話可以
在到blogger上看。
作者: jason2641668 (鋼球智者)   2021-11-27 21:22:00
直接列出未來一個月 TSLA 漲跌啦然後我跟你說你這東西高機率沒屌用FB Prophet 這東西出來超久了 連我這麻瓜都聽過這東西能炒股的話 Facebook Core Data Science Team拿這個去炒股就好 公司還要賺元宇宙幹嘛FB 現金這麼厚
作者: aq2272353712 (阿一8 )   2021-11-27 23:10:00
又在預測市場~程式線仙

Links booklink

Contact Us: admin [ a t ] ucptt.com