專利是既記載了技術信息,又能反映企業(yè)研發(fā)、市場、商業(yè)行為,甚至是產(chǎn)業(yè)發(fā)展、政策導向的一種信息載體。單篇專利很難記載和反映上述所有的信息,但是對一定規(guī)模數(shù)量的專利所包含的信息進行統(tǒng)計、梳理、歸納解讀、深度解析后,是能夠得出非常多的有價值的信息和結論的。正因為如此,越來越多的企業(yè)、行業(yè)協(xié)會、甚至政府單位開始注重專利信息的分析和利用,試圖通過分析專利所包含的信息來為自己的決策提供支撐,這是一個很好的開始,但是如何有效并且合理的利用專利的信息,是需要結合人工智能算法、從業(yè)人員的專業(yè)技能經(jīng)驗、處理數(shù)據(jù)和圖表的工具及方法等的結合才能完成的。
專利信息分析可以說是個無底洞的工作,從海量專利數(shù)據(jù)的檢索分析到單篇專利的解讀,甚至是技術特征的咬文嚼字,如果你有時間做下去,工作可以永無止境。并且專利信息分析不像專利申請一樣有固定的格式要求,通常情況下是很難標準化(基礎分析除外)的,因此,解讀出做專利信息分析的目的就顯得非常重要了。在這里,筆者嘗試從不同層次來嘗試對專利信息分析與利用做歸納。
一、大數(shù)據(jù)分析
通過預設的算法和圖表樣式將檢索出來的專利自動生成一份分析報告,這類型的專利分析報告利用專利本身自帶的著錄項目信息,或者通過預設規(guī)則將著錄項目信息和專利文件本身衍生出新的信息數(shù)據(jù)(比如屆滿時間、權利要求項數(shù)等)來進行簡單的歸納總結。其中人為參與的地方除了檢索和數(shù)據(jù)的篩選之外,更多的是表單的設計(大部分數(shù)據(jù)庫系統(tǒng)目前都支持自定義表單)和圖表的簡單解讀。
這種報告反映出的信息量有限,但是執(zhí)行的效率高,而且信息準確性高,下圖就是從某知名數(shù)據(jù)庫系統(tǒng)自動生成的簡單圖表,當然還能生成自定義的復雜圖表。
這類型的分析報告能夠快速的反應出與調查標的相關的專利申請趨勢、權利人分布、類型、有效性、按照IPC分類號得出的技術分類等信息,但是這些信息往往只能滿足調研者的基本需求,或者對調研需求者的價值度較低。因此,還需要對專利信息進行二次挖掘歸納,并且加入更多維度的分析,才能提高價值。
二、人為歸納梳理
對一篇專利進行信息的二次挖掘歸納已經(jīng)有很多成熟的做法,比如對專利歸納出技術節(jié)點、產(chǎn)品節(jié)點、功效節(jié)點等等,也可以根據(jù)專利記載的信息加上設定的評估指標,對單篇專利加上價值指標、品質指標等標簽。這里所指的技術節(jié)點、產(chǎn)品節(jié)點、功效節(jié)點絕不是通過人工智能算法來識別IPC分類號和關鍵詞來歸納和標引的。而是通過跟本領域技術人員充分溝通,事先形成一份較為客觀和完整的關于調查標的的產(chǎn)品樹、技術書和功效樹,然后將檢索的專利進行對應的節(jié)點的歸類和打標簽,這個打標簽的過程是可以借助關鍵詞、IPC分類、二次檢索等工具方法的。這部分工作是工作量最大,也是最影響分析結果準確性的步驟。完成這部分工作之后,能為專利信息分析工作往更全面、更深入、價值度更高的方向進行創(chuàng)造條件,由此產(chǎn)生的圖表分析也更加復雜和多元化,能匹配企業(yè)的決策層、研發(fā)、市場、人事等對專利信息分析利用更多的需求。
舉例說明:比如企業(yè)想通過專利來精準的識別研發(fā)人才,可以將發(fā)明人名字、時間、技術分支(二次挖掘歸納獲得)等結合,形成一個針對特定發(fā)明人研發(fā)持續(xù)性、深入性、廣泛性的分析圖表,來輔助決策,如下圖:
從圖中明顯可以看出,如果企業(yè)想找技術節(jié)點1的專家,找楊工可能比較合適,如果想找對標的產(chǎn)品5個技術節(jié)點都比較熟悉的專家,綜合考量陳工應該是比較合適的人選。或者調研需求人想知道某競爭對手在某個產(chǎn)品或技術上持續(xù)創(chuàng)新的能力,也可以通過技術/產(chǎn)品與時間的關系來分析參考。
總的來說,在加入了人為對專利的二次信息挖掘歸納后,專利信息分析的圖表組合方式、分析維度會顯著增加,并且每加入一個歸納標簽,組合方式就至少翻一倍,而且還能進行一個X軸對應一級/多級Y軸,或者一個Y軸對應一級/多級X軸的復雜圖表繪制。
三、多維度信息的結合
專利的信息分析與利用最終是要服務于企業(yè)、政府等主體做決策的,而無論是基于專利既有的標簽還是人為歸納梳理的二次標簽,都只能反映出技術相關的事實和有限的預測,雖然由此產(chǎn)生的信息量已經(jīng)非常大而且利用價值非常高了,但是對于深層次的商業(yè)行為、產(chǎn)業(yè)導向的信息反饋還是有所局限,此時就需要引入多維度的外部信息進行綜合分析,而不是單純將專利信息進行割裂分析。這里可以并入分析的多維度信息就非常多了,比如:企業(yè)投資并購信息、企業(yè)的產(chǎn)業(yè)地位、企業(yè)的競爭態(tài)勢和專利風險、核心技術人員的引入與離職、地區(qū)政策導向、企業(yè)的產(chǎn)品類型、市占率等等。舉個很簡單的例子,調研過程中發(fā)現(xiàn),某家競爭對手頻繁有企業(yè)并購行為,但是通過專利數(shù)據(jù)分析每次并購都沒有將專利納入其中,如果將商業(yè)信息和專利信息合起來看,大概率可以判斷這家企業(yè)并購的目的可能是擴大產(chǎn)能或者其他,增加自身技術實力的目的并不明顯,這時候企業(yè)就可以針對性的調整自身的應對策略。
四、追根溯源
專利信息分析除了采取常規(guī)的人工智能進行大數(shù)據(jù)分析和引入人工分析標引外,筆者認為在執(zhí)行分析過程中很重要的一點就是要學會識別“異常數(shù)據(jù)”,所謂的“異常數(shù)據(jù)”是指的專利的空白點、密集區(qū)域、重點發(fā)明人、家族專利特別多、轉讓次數(shù)特別多等等數(shù)據(jù)信息,對這些數(shù)據(jù)進行深挖,往往能得到非常有價值而且意想不到的信息。這些異常數(shù)據(jù)并不是一開始就那么顯而易見,需要從宏觀數(shù)據(jù)逐步深挖,不放過每一個“異常數(shù)據(jù)”提供的線索。當然,就像前面所提到的“專利信息分析可以說是個無底洞的工作”,對于數(shù)據(jù)信息的深度挖掘也需要結合調研需求方的需求。
專利信息分析是非常復雜、同時也非常有趣和有價值的一項工作,除了對專利專業(yè)知識的掌握之外,對于技術的理解和熟悉、溝通能力、工具的使用、經(jīng)驗方法的積累以及綜合分析的邏輯思維能力都要求非常高。
ISO14001認證需要哪些政府資料五星售后服務認證的作用和意義六大基本原則,說透生產(chǎn)看板管理服務認證——商品售后服務認證API等級標準是如何分類的?質量、環(huán)境、職業(yè)健康安全3大管理體系如何整合?到哪可以辦理AAA級信用企業(yè)等級證書多少錢掃描儀KC認證