[問題] 多個list項目取交集

作者: FantasyChopi (Fantasy_Chopin)   2022-11-08 23:49:55
譬如有個list的資料是:
list=[[a,b,c,d],[b,c],[a,c,e],[b,c,f]]
則各項目的交集有
[c](*4)
[b](*3)
[b,c](*3)
[a,c](*2)
想請教板上的大大
若是想用python找出上面的資訊
要如何操作呢
作者: tzouandy2818 (Naked Bear)   2022-11-09 00:49:00
用set()吧
作者: venomsoul (不怕太太)   2022-11-09 09:21:00
如果list下面的每個sub list內的元素都是不重複的話,遍歷每個sub list然後把每個元素當作key放進另一個dictionary,value就從1開始count,每次遇到就讓他+1,如果每個sub list的element會重複出現就先取set,以上最基本辦法
作者: lycantrope (阿寬)   2022-11-09 09:52:00
先把list of list轉list of set後就用set取交集
作者: kikicheng (ohhiyo123)   2022-11-09 10:57:00
直覺是用Apriori 但不知道是否會殺雞焉用牛刀~https://reurl.cc/x1Ezye取length就可以達到你要的結果
作者: venomsoul (不怕太太)   2022-11-09 12:38:00
喔我看懂你的題目了,我那個方法應該不是你要的解,我想想看…
作者: Hsins (翔)   2022-11-09 14:25:00
我是看不出來要取交集,還是要找元素在集合中出現的次數啦…你這樣的話還有 [a]*2 啊然後會不會有 [a, a, b] 這種? 如果還有 [a, a, c] 的話要算次數的話 [a] 要算幾次? [a, a] 要不要算是一種?
作者: venomsoul (不怕太太)   2022-11-09 14:36:00
我只想到暴力解,會用到itertools.combinations首先,把原始list裡面所有的element都單獨取出,建立arr = [a, b, c, d, e, f]然後,用combinations跑出從1個元素到len(arr)個元素的組合,假設放在arr1然後,創立一個函數,比對a, b兩個iterable物件中,a的元素是否都在中,如果都有就回傳Truea的元素是否都在b中*然後,把arr1中的每個組合跟原始list中的每個sub list跑a, b的比對函數,如果為True,檢查字典d是否有這個tuple做為key的紀錄,沒有的話就加入字典,value給1有的話,value就+1,這樣最後字典裡面就是每種combination在所有list的sub list中出現的次數,然後從字典中取出只有value > 1的key,同時跟他的value掛在一起輸出就可以了我只想到暴力解就是了Orz喔對,這是預設在每個原始list中的sub list下面的元素都不重複出現的方法然後上面Hsins大提到應該還會有[a]*2才對才符合我想的題目如果是一個sub list中會出現兩次以上的相同元素而且要視為獨立的兩個元素的話,一開始extract元素的時候就要刻意多加入一個該元素去跑combinations
作者: kakar0to (Poker Face)   2022-11-09 15:02:00
set可以處理交集的問題
作者: venomsoul (不怕太太)   2022-11-09 15:12:00
喔…小地方,跑combinations的時候不用跑到len(arr),跑到sub list最長那個長度就好
作者: HerbCat (草貓)   2022-11-15 00:13:00
作者: n3rd (全日本空輸ANA)   2022-11-17 18:10:00
set()還蠻容易理解的 而且程式碼會蠻乾淨的

Links booklink

Contact Us: admin [ a t ] ucptt.com