分享一個“找出「一技術描述」與 「多個專利請求項1 」間的相似度”的程式。
https://reurl.cc/9EmGQn
1、要使用這支程式,建議安裝,anaconda python。並且,需要gensim 套件。
2、功能:找出「一個技術描述(sentance1)」,與 「patentlist 中各專利請求項1 」間
的相似度。
3、此程式的使用方式如下:
#sentance1 指的是一個技術的描述,最簡單的方法就是一個發明的請求項的記載方式。
#patentlist 提供想要比對的美國專利書號碼,例如['US7654301B2', 'US7654300B2',
'US7654329B2']。
4、改變上述要點3中的變數sentance1及patentlist並執行後,會得到
claim_similarity.txt的文件,打開該文件後,可以得到相似度的計算值,如最後所述。
5、結果:如果把一件專利的不同組的請求項,當作sentance1時,相似度會達0.9以上。
因此,此方法有實用上的「可能性」,但實際上效果可能沒有很好,需要再優化。目前,
我把它當作閱讀順序的排序,覺得滿好用的。
如果顯示0的值,表示沒有爬到該專利的內容。
目前只能從google專利資料庫中爬到美國專利的內容。
與US5419973A間的相似度 = 0