專利分析-資料庫差異性

閱讀時間約 2 分鐘


專利分析的資料庫差異性

其實已經有蠻多文獻、心得都有討論

這邊分享一個我自己的心得


Fig.1是我自己繪製的一個專利家族連結態樣,

在圖形的繪製上x軸方向是時間軸方向,

母案是US2009289319P(Fig.1左下角紅框框處)

可以看到這件專利家族數量非常龐大

當時(2023.01.07)在統計時有900多件申請案

Fig.1. WO2021113854專利家族_PANK繪製

Fig.1. WO2021113854專利家族_PANK繪製

後來有幸在一場演講中認識的朋友,

請他幫我從另一個商用資料庫下載這件案子的專利家族,

於是就有下面這張Fig.2的統計。


Fig.2有兩個知名的商用資料庫,

分別是DI與WIPS,

同以這件WO2021113854A1這件去抓取專利家族資料時,

產生的數據不全相同,甚至數據類型也不一樣。

Fig.2. 各資料庫與手工資料差異性_PANK繪製

Fig.2. 各資料庫與手工資料差異性_PANK繪製

DI的所提供的廣義專利家族(INPADOC資料)共有1622件公開公告號,

經系統轉換後得到合計1090件申請案。


WIPS很有趣地跟DI的資料型態不同,

WIPS在系統上顯示的是共1259件patent family members,

但實際下載檔案只有取得1117件,與系統上所顯示的1259件少了142件,

經查,這142件主要為臨時案,


DI與WIPS不同之處是,

DI提供的INPADOC資料是公開/公告號,WIPS則是申請號,

兩者在資料型態上完全不同,這是其之一差異。


另一個差異是WIPS把臨時案案號算入到家族行列中,

從專利「申請」的角度來看,

這確實是申請人在申請的意志下所產生的一個「申請趨勢」,

但從具有可做為專利權運作的實際專利文件來看,

則必須僅使用具有公開公告號之申請案,

因此,若沒有深入理解個資料庫所提供的資料上的差異,

將會導致分析結果的差異。


其之三的差異是WIPS扣除掉臨時案數量後,

得到的專利家族申請數量比DI多出27件,

此數據的差異會導致分析人員在進行專利分析時母體數據上的落差,

進而影響到後續分析(例如申請趨勢、IPC、專利權人分析、國家地區別分析...等等),

甚至。


在最後,我也運用了一些技巧,

以人工方式進行專利家族的擷取(Fig.2中handmade資料),

獲得專利家族數量共1349件申請案,合計1999件公開公告號,

與DI、WIPS系統所提供的家族數量相差又更大,

因此可推見後續的分析數據上又勢必相差更多,

一旦數據相差越多,分析結果漂移的程度會更大,

造成分析結果上的偏差甚巨。


結論1: 要充分了解所用的資料庫特性。

結論2: 如果要用到兩個以上的資料庫進行分析時,

千萬要小心資料庫差異所造成資料不匹配。

結論3: 人工抓取雖然是最完整的,但是所耗的時間跟人力卻是最高的,


留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Sebastian PaNK的沙龍 的其他內容
製作時間:2023.06.17 經整理,華為的廣義家族案數共59,174案 公開/公告案合計共32,2155件
製作時間:2023.06.17 經整理,華為的廣義家族案數共59,174案 公開/公告案合計共32,2155件
你可能也想看
Google News 追蹤
Thumbnail
前篇文章已透過文獻數據分析結果,與大家聊過專利被賦予IPC及CPC的實際情形,及使用CPC建立專利檢索式時會遇到的風險。 但,這可以代表我們在建立專利檢索式時,使用IPC就完全萬無一失、沒有任何風險了嗎? 本文將進一步由另一篇文獻的數據分析結果,說明使用IPC可能會遇到的風險。
Thumbnail
在前篇文章中,已向大家彙整並簡單介紹了國際5大專利分類系統,所以本篇文章將接續前篇主題,以文獻數據分析結果,說明專利被賦予IPC及CPC的實際情形。
Thumbnail
進行專利分析時,選擇合適的專利分類號(如IPC與CPC)來建立專利檢索式至關重要。 但多數專利分析者往往不知道的是,不管是選用IPC還是CPC來建立專利檢索式,其實都隱藏著檢索不完全的風險… 因此,本系列文章將與大家聊聊使用專利分類號的可能面臨的風險,以及降低其使用風險的方式。
要申請專利之前,一定必做的功課就是專利檢索,但專利實在太多了,除了台灣專利之外,其他國家的專利也是搜尋內容之一,多數企業都在專利檢索上耗費了大量時間和人力,隨著科技進步,現在也可以用AI幫你快速蒐集且過濾專利。
今天要講一個比較進階的專利檢索項目,為了確認商品在預計販售的地區,沒有侵權疑慮,可以自由販賣,所以要針對商品的主要特徵去檢索,包含單一特徵、組合特徵,都要在選定區域逐一排查,才能避免商品技術遭控侵權而無法順利銷售。
專業價值多少,這真的是一個千古難題,舉例來說,現在這個時代,自行接案的人越來越多,但這些SOHO族提供的服務內容、品質都有不同程度的落差,而對於業主來說,希望以最低預算(甚至免費)得到高品質內容的期待是不變的,因此造成雙方的認知落差。
相較於商標,專利並非一般店家或民眾會需要的服務,而是公司行號的研發團隊才會接觸到的部分,而研發人員們平日專注在新發明,對於申請專利這種行政類的工作可能不太擅長,大公司可能有自己的專利人員,但大部分的公司還是會將申請專利的工作交給合作的事務所處理。
多數國家將專利分為發明、新型、設計三大類,發明人常常不知道該申請哪一種專利比較好,多數事務所也只能照法律規範來給客戶建議,但其實應該有更好的判斷標準。
台灣人經常申請的有德國、法國、台灣、日本、南韓、中國、澳洲等地的新型專利,各國規定略有不同,如有需要申請新型專利,可以來電洽詢。相較於發明專利,新型專利有時候因取得速度快、成本低的優勢而為更好的選擇。
專利是指對新的技術、產品或方法所享有的獨特權利,通常由政府機構授予,用於保護發明者或創新者的知識產權。
Thumbnail
前篇文章已透過文獻數據分析結果,與大家聊過專利被賦予IPC及CPC的實際情形,及使用CPC建立專利檢索式時會遇到的風險。 但,這可以代表我們在建立專利檢索式時,使用IPC就完全萬無一失、沒有任何風險了嗎? 本文將進一步由另一篇文獻的數據分析結果,說明使用IPC可能會遇到的風險。
Thumbnail
在前篇文章中,已向大家彙整並簡單介紹了國際5大專利分類系統,所以本篇文章將接續前篇主題,以文獻數據分析結果,說明專利被賦予IPC及CPC的實際情形。
Thumbnail
進行專利分析時,選擇合適的專利分類號(如IPC與CPC)來建立專利檢索式至關重要。 但多數專利分析者往往不知道的是,不管是選用IPC還是CPC來建立專利檢索式,其實都隱藏著檢索不完全的風險… 因此,本系列文章將與大家聊聊使用專利分類號的可能面臨的風險,以及降低其使用風險的方式。
要申請專利之前,一定必做的功課就是專利檢索,但專利實在太多了,除了台灣專利之外,其他國家的專利也是搜尋內容之一,多數企業都在專利檢索上耗費了大量時間和人力,隨著科技進步,現在也可以用AI幫你快速蒐集且過濾專利。
今天要講一個比較進階的專利檢索項目,為了確認商品在預計販售的地區,沒有侵權疑慮,可以自由販賣,所以要針對商品的主要特徵去檢索,包含單一特徵、組合特徵,都要在選定區域逐一排查,才能避免商品技術遭控侵權而無法順利銷售。
專業價值多少,這真的是一個千古難題,舉例來說,現在這個時代,自行接案的人越來越多,但這些SOHO族提供的服務內容、品質都有不同程度的落差,而對於業主來說,希望以最低預算(甚至免費)得到高品質內容的期待是不變的,因此造成雙方的認知落差。
相較於商標,專利並非一般店家或民眾會需要的服務,而是公司行號的研發團隊才會接觸到的部分,而研發人員們平日專注在新發明,對於申請專利這種行政類的工作可能不太擅長,大公司可能有自己的專利人員,但大部分的公司還是會將申請專利的工作交給合作的事務所處理。
多數國家將專利分為發明、新型、設計三大類,發明人常常不知道該申請哪一種專利比較好,多數事務所也只能照法律規範來給客戶建議,但其實應該有更好的判斷標準。
台灣人經常申請的有德國、法國、台灣、日本、南韓、中國、澳洲等地的新型專利,各國規定略有不同,如有需要申請新型專利,可以來電洽詢。相較於發明專利,新型專利有時候因取得速度快、成本低的優勢而為更好的選擇。
專利是指對新的技術、產品或方法所享有的獨特權利,通常由政府機構授予,用於保護發明者或創新者的知識產權。