作業系統:linux
問題類別:ML、DL、Optimization
使用工具:python3
問題內容:
小弟我遇到一類問題,需要預測一個母體中的各項item的組成成分比例
所以Target可能有A,B,C,D+others五種構成 五種加起來總合為1(100%)
因為是同一母體,所取得用來預測的特徵或訊號是一樣的
等於我要用同一組預測五種Y(預測結果舉例: A20%, B30%, C10%, D10%, others30%)
看了一下Sklearn的 multiple output regression並沒有適合的限制式模型(限制總預測
需小於1)
而如果要自己設計模型
目前想到的是用簡單神經網路BPNN 加上客製化的MSE Loss funciton
除了五種Y的MSE加總外再加上懲罰項α(Sum(yA+yB+yC+yD+yOthers)-1)^2
不知道我這樣構想有無缺漏,因為就算這樣好像也不能保證神經網路出來的總和必定小於
1?
還是有更適合的模型
已經爬很久了 都沒有類似的收穫
Beta Regression很類似我需求但沒有往Multiple Y拓展的參考