Hi 大家好 想問一個觀念題
我有一個其他程式每天會固定輸出一個固定格式的csv到固定的資料夾
我目前已經實現用dataframe把當日新的csv內重複的資料刪除並保留最新的 並將每天處
理過的csv
另存到其他資料夾並自動上傳到雲端
ex:
人名,穿著,時間
小明,黃色衣服,17:50 6/18
小明,紅色衣服,18:50 6/18
根據同樣的人名小明 只保留最新時間的資料的小明紅色衣服資料 刪除舊的小明黃色衣服
的資料
但我現在遇到的問題是如果有跨csv的重複人名資料 ex小明可能會出現在前天6/16的跟今
天6/18的csv 我要刪除舊的重複資料就會有難度 請問有沒有比較好的方法來去做管理?
for loop把所有csv read到同一個df感覺沒有有點不切實際?因為我有非常多csv檔
謝謝