作者:
TZULIU (消費券收購商)
2019-01-30 12:08:39我打算分析100多個會議文件,
範例如下:https://tinyurl.com/yalydvd8
但在分析之前,我想先將文件轉成資料儲存,
資料中的每一行,第一個數值是發言者,第二個數值是發言者的發言內容。
例如:["張三","我今天早上吃了一碗滷肉飯,超好吃的。"]
我目前的進度如下:
Name = []
sentence = []
file = open('會議文件','r')
for line in file:
if line.find(':') != -1:
tokens = line.split(":")
Name.append(tokens[0])
else:
sentence.append(line + " ")
我現在想不通該怎麼樣把得到的發言者姓名和內容放在一起,
然後再繼續找下一個發言者和發言內容。
還請各位高手幫忙解惑,謝謝!
作者:
nini200 (200妮妮)
2019-01-31 01:29:00只用:判斷 後面不同人的發言 沒法分類正確吧?大致上有寫出來了 給你參考先找出所有說話者 重複的用集合去掉我的方法 A陣列儲存要的名字行號B陣列儲存非要的名字行號C陣列將AB陣列合併例A=[0,9]B=[3,6,11]C=[0,3,6,9,11,16]0-3 9-11就是要的內容 C陣列16是最後一行打錯 B陣列儲存非要名字含冒號的行號我的方法比較麻煩 有更好方法煩請告知