推 MrCAKE: 如果是這樣,關鍵字拓展之後還是卡關,就要想其他招了 06/26 08:35
推 MrCAKE: 以後AI檢索更強的話應該能幫忙(吧) 06/26 08:41
推 patentable: 以目前機器學習的AI架構,還沒辦法做到瞭解文義 06/26 09:49
→ patentable: 對於檢索的幫助其實非常有限,主要用在統計用字頻率 06/26
09:50
https://hant-kb.kutu66.com/others/post_13649887
目前的AI可以做到「句子相似度」的計算,如上連結。
'this is a sentence'及'this is also sentence'的計算結果,高達0.915479828613的
近似度。
因此,如果要用機器幫忙找前案的話,可以先寫下要找的句子(或詞袋),然後用「句
子相似度」的演算法,來找出近似的專利。word2vec是由google提出來,google專利資料
庫的近似專利,應該也是用這個演算法計算出來的。
考慮到專利用語的多變化,(以下是我亂想的,沒有理論基礎)想要提高演算的精確度時
,選擇詞袋中的詞就很重要,可以考慮先對句子中的詞進行處理。舉例,可以考慮先把
下位詞更換成上位詞,或者把所有的近似詞換成相同的詞等,但這個需要自己整理詞庫。
因此,個人認為用機器幫忙找專利,是有機會的,但需要為不同的領域準備好自己的
詞庫。要用一般的詞庫應該很難達到實用的效果。
下面有整理出幾個句子相似度的演算法。
https://reurl.cc/WdQkVx