Re: 資料不平衡

作者: kerycheng (kk)   2024-05-20 17:41:09
※ 引述《sustainer123 (caster)》之銘言:
: 沒下雨的資料>>>>>暴雨的資料
: 差距可能差了幾十倍
: 這種應該算不平衡
: 假如換成沒下雨跟小雨
: 差距可能就3.X倍
: 這算不平衡嗎?
: 還有我無法理解隨機複製樣本或刪除樣本的邏輯
: 假如強行把暴雨跟不下雨變1:1
: 這不就完全不符合現實世界
姆咪研究所在研究人臉辨識
把切好的人臉圖丟給model轉換成array數值
同一張人臉投射在維度裡會相對分布比較集中
但可能會有幾張人臉年代比較久遠或怎樣的,會被離稍微遠一點
後來教授就弄了一個公式讓我下去套
把每一張人臉先平均後再根據平均值去導出各自的加權數
讓相對接近的人臉它的加權變大,不接近的人臉加權變小
其實姆咪我不是很確定,我那時候寫的code到底對不對
反正跑起來很像一回事就拿來用了,搞不好最後得出的結果都是錯的捏
哭了
作者: sustainer123 (caster)   2024-05-20 17:48:00
調整加權來平衡資料 我有看到這解法CNN能改這個
作者: kerycheng (kk)   2024-05-20 17:50:00
但是我的研究比較偏向利用model得出的數值去做後續計算model基本上是不動的,頂多就是使用不同版本的model去統計結果得出哪個model比較適合哪種計算方法
作者: sustainer123 (caster)   2024-05-20 17:55:00
還能等結果出來再處理喔 學到了我看到的方法要不預處理時就做好 要不就模型搞加權

Links booklink

Contact Us: admin [ a t ] ucptt.com