专利技术信息检索策略解析
发布时间:2019-08-26 00:46:15
文/贾丹明
通常而言,专利信息检索包括检索属于某个技术主题的全部专利文献的专利技术信息检索、为判断技术方案的新颖性而进行的专利新颖性检索、为找到某件专利申请的所有同族专利申请而进行的同族专利检索,以及为了解某项专利申请的法律状态信息而进行的专利法律状态检索等。其中,专利技术信息检索以其广泛的应用范围在专利信息检索中占据十分重要的位置,例如在科研立项、技术创新、制定企业专利战略、评价一项要授予许可证的或者考虑收购的特定技术等具体工作中,为了熟悉某个特定技术领域中的现有技术而必须要进行技术信息的检索。专利技术信息检索将为上述活动提供技术背景信息,并可以确定给定领域中哪些专利已经公开。由于专利技术信息检索结果在上述工作中发挥着导向作用,因此,其检索结果的优劣将直接影响相关工作的成效。
专利技术信息检索是以一个技术主题为目标对专利文献进行检索,从而找出一批参考文献的过程,也就是说,专利技术信息检索是希望找到记载相同技术主题的专利文献的集合。那么,如何才能在海量的专利文献中尽量找到所有记载该技术主题的文献,同时检索结果中与该技术主题无关的文献又尽量少呢?即,如何同时提高检索结果的查全率和查准率呢?影响检索结果的因素有很多,例如,检索系统的数据量、数据特点、可实现的检索功能和检索策略的制定等。其中,检索策略的制定作为可控因素对检索结果的查全率和查准率会产生重要影响。本文将通过一个实例详细解析专利技术信息检索策略的制定。
正确分析技术主题
在检索开始之前,对技术主题的正确分析是进行有效检索的基础。准确理解待检索技术主题应当首先尽可能了解背景技术。对背景技术的充分了解是准确理解待检索技术主题的前提,既可以通过专利文献了解背景技术,也可以通过非专利文献了解背景技术。一般来说,可以通过对技术主题进行初步检索,通过初步检索结果文献获取相关背景技术资料。与撰写专利申请文件的“背景技术”部分不同,在技术信息检索前对于背景技术的了解应当尽可能全面了解所有背景技术,即,应当尽可能了解该技术主题的所有阶段的发展状况,而不是只关注最新的背景技术状况。
在理解技术主题时,要明确主题的类别,例如是方法、产品、设备还是材料。方法包括:聚合、发酵、分离、成形、运送、纺织品的处理、能量的传递和转换、建筑、食品的制备、试验、操作机器的方法及其作用方式、信息处理及传输方法等;产品包括:化合物、组合物、织物、制造的物品等;设备包括:化学或物理工艺设备、各种工具、各种器具、各种机器、各种执行操作的设备等;材料包括混合物的成分等。需说明的是,一个设备,由于它是通过一种方法来制造的,可以看作是一件产品。这里的“产品”只是用来表示某一方法的结果,而不管该产品其后的功能如何,这里的“设备”是与其某种预期的用途或目的联系在一起的,例如,用于产生气体的设备、用于切割的设备。此外,材料本身也可以构成产品。
另外,还要想到待检技术主题的各种可能应用领域及可实现的各种功能。一个技术主题涉及多种应用领域的情况很多,如,“剪刀”可以涉及的应用领域包括:裁剪服装的剪刀、园艺修枝的剪刀、手术用的剪刀、专用于眼睛手术的剪刀等等。一个技术主题涉及多种功能的情况也很多,如“勺子”可以涉及的功能包括辅助进食、盛取调料、量取药物等。
在理解技术主题时,在通过对以上几个方面进行全面、准确的把握后,对技术主题本身的理解可能会与检索委托方的主观愿望存在不一致的情况,这时就需要与检索委托方多沟通,从而进一步修正和明确检索的技术主题。例如,在某一次委托检索中,委托检索的技术主题为“中草药制备的杀虫剂”的中国专利文献。通过了解背景技术,全面、充分地理解技术主题,考虑到各种可能的功能及可能的应用领域,需要和检索委托方进一步确认:该技术主题是否包括“中草药制备的杀灭蚊、蝇、蟑螂等害虫的制剂”、“中草药制备的杀菌、消毒、防蛀的制剂”,对剂型有无限定,对物理方法制备或化学方法制备有无要求等。通过与委托方交流沟通,最终明确检索技术主题是“农用中草药杀虫剂”,也就是“植物农药”。对检索技术主题的准确理解和把握将为下一步确定检索的技术领域奠定基础。
确定技术主题的技术领域
确定技术主题的技术领域实际上就是确定该技术主题涉及的国际专利分类(IPC)位置。根据IPC的使用指南,IPC被创建的首要目的就是为各知识产权局和其他使用者提供一套用于高效检索专利文献的工具,并且主要就是为了便于技术主题的检索。它的设计和应用理念是:同一技术主题都归在同一分类位置上,从而能够从同一分类位置检索到该技术主题的专利文献。目前,有超过100个国家、4个地区专利局和世界知识产权组织(WIPO)使用IPC。因此,使用IPC进行技术主题检索既能提高检索的查准性,又能保证检索的查全性。
在确定技术主题的IPC分类位置时,首先应当确定那些技术主题所属的技术领域的IPC分类号。一般来说,所属的技术领域根据该技术主题特定功能和用途以及相应的具体实施例来确定。由于技术信息检索只针对技术主题进行检索,没有具体的实施例,因此,应根据在理解技术主题时考虑到的所有可实现的功能和所有可能的应用领域,并且不对具体实施例作出任何限制找到所有该技术主题所属的分类位置。这些分类位置应当包括:完全符合检索技术主题的大组或小组,用C1、C2、……、Cn表示,即,C1、C2、……、Cn分类号下的文献完全属于检索的技术主题;不完全符合检索技术主题的,但是与检索技术主题有关的大组或小组,用U1、U2、……、Un表示,即,U1、U2、……、Un分类号下的文献不完全属于检索的技术主题,仅有部分文献属于检索的技术主题。
以“农用中草药杀虫剂”这一技术主题为例,确定该技术主题的技术领域是A01N65/00及其下所有的小组。因为A01N65/00涉及“含有藻类、地衣、苔藓、多细胞真菌或植物材料,或其提取物的杀生剂、害虫驱避剂或引诱剂或植物生长调节剂(含有以确定的化合物入A01N27/00至A01N59/00)”,其下的所有小组均按照植物的科进行细分,不存在明显排除的技术主题。A01N65/00及其下所有的小组涉及的技术领域除了包括农用的杀虫剂之外,还包括非农用杀生剂、害虫趋避剂或引诱剂或植物生长调节剂,例如:杀死寄生虫或病毒的制剂、驱赶蚊虫的制剂、引诱蟑螂的制剂、促进植物快速生长的植物生长调节剂等。因此,A01N65/00及其下所有的小组属于不完全符合检索技术主题的,但是与检索技术主题有关的分类位置,用U1、U2、……、Un表示。
在确定了检索的技术领域后,应注意,如果希望检索到相关领域的外观设计专利文献,还应当找到相应的洛迦诺分类号,因为IPC分类仅用于检索发明和实用新型等涉及技术方案的专利文献。
确定限定概念
上述步骤确定的检索技术领域的分类位置包括两种,一种是完全符合检索技术主题的大组或小组,即C1、C2、……、Cn,这些分类号下的文献完全属于检索技术主题,因此,可以直接使用上述大组号和小组号进行检索;另一种是不完全符合检索技术主题的,但是与检索技术主题有关的大组或小组,即U1、U2、……、Un,这些分类号下的文献不完全属于检索的技术主题,仅有部分文献属于检索技术主题,因此,需要对这些分类位置进行进一步的限定,确定能够进一步限定上述分类位置的概念。
确定限定概念的关键在于明确分类的主题与检索技术主题的区别。在分类表中,大组的类名确切地限定对检索目的有用的在其所属小类范围内的一个技术主题领域,小组的类名确切地限定对检索目的有用的在其所属大组范围内的一个技术主题领域。很多情况下,检索的技术主题与相关的分类领域限定的技术主题是有差别的,这种差别之处就是需要进一步限定的概念。限定概念与不完全符合检索技术主题的分类(U1、U2、……、Un)结合能很好地筛选位于这些分类位置的文献。
为了使检索思路清晰,建议使用表1所示的表格表达限定概念。
| 检索的技术主题 | |
完全覆盖的分类位置 | C1 | |
C2 | ||
…… | ||
Cn | ||
需要限定的分类位置 | U1 | 限定概念1 |
U2 | 限定概念2 | |
…… | …… | |
Un | 限定概念n |
同样以技术主题“农用中草药杀虫剂”为例,由于确定分类A01N65/00及其下所有的小组均属于不完全符合检索技术主题的,但是与检索技术主题有关的分类位置,因此,需要使用限定概念对这些分类位置进行进一步的限定。由于A01N65/00的分类位置限定的技术主题是“含有藻类、地衣、苔藓、多细胞真菌或植物材料,或其提取物的杀生剂、害虫驱避剂或引诱剂或植物生长调节剂”,它与检索技术主题“农用中草药杀虫剂”的区别在于:A01N65/00除了包含“农用的”还包含“非农用的”;在农用制剂里面,除了包含杀虫类的,还包含调节植物生长的。因此,限定概念应当是:农用且非植物生长调节剂。A01N65/00其下的所有小组均按照植物的科进行细分,而不是按照杀虫或调节植物生长等不同作用细分,因此,对其下所有小组的限定概念与对大组的限定概念相同,均是:农用且非植物生长调节剂。该例的限定概念表如表2所示。
表2 检索实例的分类及限定概念表
| 农用中草药杀虫剂 |
|
需要限定的分类位置 | A01N65/00 | 农用且非植物生长调节剂 |
A01N65/03 | 农用且非植物生长调节剂 | |
…… | …… | |
A01N65/48 | 农用且非植物生长调节剂 |
对限定概念进行表达
在确定了限定概念以后,还应将这些限定概念表达成数据库能够识别的形式,从而用于在数据库中进行检索,找到相关技术主题的文献。对限定概念进行表达就好像在限定概念和数据库之间搭建一座桥梁,使得检索系统能够识别想要检索的技术内容,同时,能够将数据库中具备上述限定概念的文献检索出来。由于限定概念是对分类号定义的技术主题的进一步限定,因此,一般使用关键词表达,有的技术领域还可以用化学结构式、生物序列等形式表达。
对限定概念进行表达既可以采用正向表达方式,也可以采用逆向表达方式。所谓正向表达,是指采用与限定概念的技术含义相一致的同义词、近义词、上位概念、下位概念等对限定概念进行表达。由于这些表达与限定概念含义一致,因此,需进一步限定的分类位置和上述正向表达之间用逻辑“与”的关系进行组合。所谓逆向表达,是指采用与限定概念的技术含义相反的同义词、近义词、上位概念、下位概念等对限定概念进行表达,其目的是把不属于检索技术主题的文献从分类位置中检索出来,则分类位置中检索结果以外的文献就是属于检索技术主题的文献。由于这些表达与限定概念含义相反,因此,需进一步限定的分类位置和这些逆向表达之间用逻辑“非”的关系进行组合便可得到检索技术主题的文献。可以将限定概念表达填写在表1中,以便为下一步检索式的构建提供清晰的检索思路。但此时应注意是采用正向表达还是逆向表达。
对于“农用中草药杀虫剂”检索技术主题来说,对“农用且非植物生长调节剂”限定概念的表达分析如下:首先通过初步检索,发现关于农用杀虫剂的专利文献涉及各种针对不同植物种类或不同害虫种类的杀虫剂,而文献表达中很多并不采用“农用”或“农业”或“农作物”等用词,而是直接采用植物名或害虫名,很难穷举。而非农用的杀虫剂和害虫趋避剂的种类有限,基本上都是关于“蚊、蝇、鼠、蛀、蟑、霉、病毒、寄生虫、蛲虫、昆虫、消毒、虱”等的,因此将上述不属于农用的文献检索出来,分类位置中其余的文献就是属于农用的了。因此,对限定概念“农用”采用上述逆向表达方式能比较容易地检索出所需的文献。对于限定概念“非植物生长调节剂”,由于该概念本身就是带有否定词的用语,因此,可以采用其逆向表达“调节”将涉及调节剂的文献检索出来,分类位置中其余的文献就是涉及“非调节”的技术主题了。
综上,对“农用且非植物生长调节剂”限定概念的表达采用逆向表达“蚊+蝇+鼠+蛀+蟑+调节+驱避+霉+病毒+寄生虫+蛲虫+昆虫+消毒+虱”及表达用途和效果的词汇“衣物+趋避”,将相关分类位置中不属于“农用中草药杀虫剂”的文献检索出来,分类位置中剩余的文献就是属于“农用中草药杀虫剂”的文献了,如表3所示。
表3 检索实例的限定概念表达
| 农用中草药杀虫剂 | |
逆向表达 | 逻辑“非” | |
需要限定的分类位置 | A01N65/00 | 蚊+蝇+鼠+蛀+蟑+霉+病毒+寄生虫+蛲虫+昆虫+消毒+虱+衣物+驱避+调节 |
A01N65/03 | 蚊+蝇+鼠+蛀+蟑+霉+病毒+寄生虫+蛲虫+昆虫+消毒+虱+衣物+驱避+调节 | |
…… | …… | |
A01N65/48 | 蚊+蝇+鼠+蛀+蟑+霉+病毒+寄生虫+蛲虫+昆虫+消毒+虱+衣物+驱避+调节 |
构造检索式
构造检索式是将确定的分类位置和限定概念的表达之间按照一定的逻辑运算关系组合起来。由于所确定的所有分类位置均是涉及检索技术主题的分类领域,也就是说,所确定的每一个分类位置均包含一定数量的检索技术主题的文献,因此,这些分类位置之间是逻辑“或”的关系。对于完全覆盖的分类位置,其下所属的文献全部属于检索技术主题,不需要进一步限定,因此,完全覆盖的分类位置的分类号本身就构成了这些位置的检索式。
对于需要进一步限定的分类位置,则根据对限定概念的不同表达采用不同逻辑关系的检索式:如果采用的是正向表达,则分类号与正向表达之间采用逻辑“与”的关系构成该分类位置的检索式,如果有多个不同的正向表达,则这些正向表达之间是逻辑“或”的关系;如果采用的是逆向表达,则分类号与逆向表达之间采用逻辑“非”的关系构成该分类位置的检索式,如果有多个不同的逆向表达,则这些逆向表达之间是逻辑“或”的关系。不同表达方式构成的检索式如下(逻辑或用“+”表示,逻辑“与”用“*”表示,逻辑非用“-”表示)。
限定概念用正向表达,检索式为:Result= C1+C2+……+Cn+〔U1*(表达1+表达2+……+表达n)〕+〔U2*(表达1′+表达2′+……+表达n′)〕+……+〔Un*(表达1″+表达2″+……+表达n″)〕
限定概念用逆向表达,检索式为:Result= C1+C2+……+Cn+〔U1-(表达1+表达2+……+表达n)〕+〔U2-(表达1′+表达2′+……+表达n′)〕+……+〔Un-(表达1″+表达2″+……+表达n″)〕
以“农用中草药杀虫剂”检索技术主题为例,由于其采用的是逆向表达,最终的检索式为:(A01N65/00+A01N65/03+……+A01N65/48)-(蚊+蝇+鼠+蛀+蟑+霉+病毒+寄生虫+蛲虫+昆虫+消毒+虱+衣物+驱避+调节)。
在很多检索系统中,分类号的检索入口支持右截断检索,因此,可以将上述A01N65/00大组及其下所有的小组的检索表达式“A01N65/00+A01N65/03+……+A01N65/48”在检索系统中表达为“A01N65”,此时,可以将上述检索表达式进一步简化为:A01N65-(蚊+蝇+鼠+蛀+蟑+霉+病毒+寄生虫+蛲虫+昆虫+消毒+虱+衣物+驱避+调节)。
检索的调整与中止
通过上述检索,如果检索结果中有大量不属于检索技术主题的文献或者分类位置中有相当数量的相关文献没有包含在检索结果中,有可能是原来确定的技术领域不正确,或者对限定概念的提取不恰当,或者是对限定概念的表达与数据库有偏差。这时,就需要重新确定技术领域,或对限定概念,其表达方式,以及它们构造的检索式重新进行调整。
从理论上说,任何完善的检索都应当是既全面又彻底的检索。但是从成本的合理性角度考虑,检索要有一定的限度。因此,检索是否全面和准确是相对而言的,何时中止检索较为合适需要从时间、精力和成本等方面来考虑,或者从已经检索出的文献的数量和质量来判断是否应当继续检索。
一般来说,如果检索结果中85%以上是涉及检索技术主题的文献,同时,相关技术领域中未包含在检索结果中的涉及检索技术主题的文献数量占检索结果文献数量的百分比不超过15%,则可以中止检索。或者从时间、精力和成本上来看不值得继续检索的,可以中止检索。由于技术信息检索结果的查全率和查准率不可能达到100%,因此,在对检索结果进一步进行分析之前,先要进行数据清理。
在“农用中草药杀虫剂”检索技术主题的检索实例中,在中国专利文献数据库中进行检索,得到检索结果1374篇,通过浏览检索结果,其中90%以上是涉及“农用中草药杀虫剂”的文献,而相关分类位置中涉及该技术主题的文献不超过100篇,因此,检索结果具有较高的查全率和查准率,可以终止检索了。如果需要了解国外相关领域的文献状况,还需在国外专利文献检索数据库中进行检索,检索策略相同。
最新资讯
-
08-12 0
-
12-26 1
-
08-11 0
-
08-16 1
-
08-17 1
-
08-04 1