随着人工智能技术日益广泛渗透到文献检索领域,智能检索时代已经来临。智能检索工具的代表Patentics已成为专利检索的工具之一。
Patentics属于智能语义检索,可采用概念检索或关键词检索等多种检索方式,并能够对检索结果按相关性排序。检索实践中,审查员常用“R/申请号”或“R/公开号”的方式进行检索。但文献浏览是一个非常耗时的过程,如果对比文件相关性排序位置太靠后的话,会极大影响检索效率。因此,经常需要采用人工干预,结合“A/”“B/”“ICL/”等常用布尔检索命令进一步缩小语义排序的文献范围。
电学、通信领域发明专利申请的技术特征,通常以电路结构或协议等形式出现,关键词表达较为多样,不易用关键词准确表达,分类号的去噪效果也不理想。因此,直接在Patentics中用“R/申请号”或“R/公开号”的方式进行检索,会存在对比文件出现的位置不确定的问题,需要审查员进行适当的人工干预,以缩短时间,提高检索效率。为此,笔者结合实际案例,着重分析电学、通信领域Patentics检索可采用的人工干预策略和手段,以供业内参考。
一、结合发明点提炼关键词及分类号,合理选择检索范围字段
Patentics中仅利用“R/申请号AND关键词”或“R/公开号AND关键词”的限定,可能不易检索到相关文献。此时应该准确理解发明,提炼与发明点相关的关键词和分类号。同时,Patentics中检索范围字段“A/”包括标题、摘要、权利要求中含有的关键词,类似于专利检索与服务系统(下称S系统)中的“BI”。检索范围字段“B/”是全文关键词检索,包括专利文献中所有文字(S系统中如果检索全文关键词需切换到全文数据库中)。因此,需要根据领域申请的特点选择检索范围字段“A/”或“B/”。下面笔者结合案例1进行分析。
【案例1】
权利要求:一种AD采样电路,其特征在于,所述AD采样电路包括用于放大采样电压的多个电压放大器,各个电压放大器的放大倍数均是不同的,每个电压放大器都连接有一AD转换器,并通过所述AD转换器将放大后的采样电压转换为数字信号;其中每个电压放大器还均包括一个参考电压,所述电压放大器通过所述参考电压将放大后的采样电压调节至0伏以上。
检索分析及过程:本案的发明点为AD采样电路,包括用于放大采样电压的多个电压放大器,各个电压放大器的放大倍数均不同。
本案技术方案的电路结构清楚,关键词主要包括“AD”“采样”“放大器”,但是本领域中包含这些关键词的电路多种多样,实现的功能也各不相同,因此,仅仅通过电路结构相关的关键词检索噪声较大,文献浏览工作很大。下面笔者介绍Patentics的语义检索过程。
首先,在Patentics中采用“R/申请号”或“R/公开号”进行初步检索,检索结果中虽然有不少语义相关度很高的文件(语义相关度达到95%以上),但这些高相关度文件的技术方案都涉及常规的提高ADC采样精度或者ADC自身结构改进,这与本申请的“用于放大采样电压的多个电压放大器,各个电压放大器的放大倍数均不同”完全不同。同时,未发现有抵触申请、可用于追踪检索的文件等。
其次,增加关键词,缩小范围,增加涉及发明点“多路电压放大器,并且放大倍数不同”的关键词限定,以得到实质相关的文献。首先,提炼与发明点最相关的电路结构“电压放大电路”作为关键词,构造检索式:“R/申请号ANDB/(电压放大器OR电压放大电路)”,检索结果领域分散,涉及电流检测、模拟信号采样、多通道模数转换等。虽然文件相关度达90%以上,但技术方案实质不同,仍然没有X/Y文件。转换思路,由于AD采样领域中,包括信号采样、电压转换和AD转换三个部分,而本申请的发明点在信号采样阶段,因此,将“采样”作为关键词构造检索式:“R/申请号ANDB/采样”,检索结果中虽然没有X/Y文件,但是检索结果的领域与本申请基本一致,检索首页中大多数文件都涉及AD采样电路,并且文献相关度达到95%至97%,说明关键词“采样”有效。
再次,提炼发明点“用于放大采样电压的多个电压放大器,各个电压放大器的放大倍数均不同”中电路结构相关的词汇“采样”“多路”“放大器”,其中“多路”在本领域中存在多种表述,包括多种、多条、多路等,因此将“多”作为关键词。同时,将“放大器”扩展为“放大器”和“放大电路”。同时,考虑到电路领域的申请一般都在摘要中描述电路组成结构,因此,选择“A/”在摘要中检索以缩小检索的范围,构造检索式:“R/申请号ANDA/[采样AND(放大电路OR放大器)AND多]ANDICL/H03M”,在第2页(限定每页显示10条检索记录,下同)得到X文献。根据说明书实施例的描述“电压经过两路放大电路被分别放大后,选取电压范围较大的值作为ADC输入值”可知,具有多路电压放大输出的信号,在进入ADC之前需要对信号进行选择,选取其中一路进入ADC进行模数转换。因此,进一步提炼发明点关键词“选择”,延伸该关键词“切换”,构造检索式:“R/申请号ANDA/[采样AND(放大电路OR放大器)AND多AND(选择OR切换)]ANDICL/H03M”,该X文献被提前至第1页。
案例启示:电学领域中电路相关的专利申请,虽然关键词、分类号通常比较明确,但是对技术方案的描述有多种形式,要素与要素之间的关系尤为重要。仅利用“R/申请号”或“R/公开号”的限定,可能检索不到相关文献。此时,应该准确理解发明,提炼与发明点相关的关键词,循序渐进,在Patentics的语义排序中不断缩小检索范围。而且还要了解语义检索结果的概况,从而有助于快速判断构建的检索式或关键词是否有效,及时调整检索策略,提高检索效率。
需要注意的是,人工干预应尽量避免本领域常识性的关键词或高频次词汇,因为这样的词进行干预所圈定的范围对检索结果意义不大。相反,应选取能够反映发明构思或技术方案,并有实质含义的关键词。对于所选取的用于人工干预的词,应该进行必要的扩展,至少覆盖到同义词和近义词,否则将导致漏检风险。在Patentics中根据不同技术领域专利申请的特点合理选择检索范围,灵活选择检索范围字段“A/”或检索范围字段“B/”,可提高检索效率。
二、灵活选择检索数据库
Patentics支持在中国专利库、中国申请库、美国专利库、美国申请库、欧洲专利库、欧洲申请库、PCT申请库、日本申请库等二十多个数据库中进行检索。实际检索过程中,可以灵活选取数据库以提高检索效率。对于一个检索式,如果选取在多个数据库中进行检索,系统计算和排序会比较困难,因此,一般推荐在单库进行检索。一般地,对于中文申请(申请文本是中文的申请),选取在中国专利库或者中国申请库中进行检索,对于英文申请(申请文本是英文的申请),选取在美国专利库、美国申请库、欧洲专利库或欧洲申请库中进行检索。但是检索系统不是一成不变的,在有些情况下,需要根据实际情况灵活选择数据库,提高检索效率。下面结合案例2进行分析。
【案例2】
权利要求:一种含多方向背光模组的集成成像显示装置,其特征在于:包括LCD显示屏、位于LCD显示屏背后的多方向背光模组、以及位于LCD显示屏前侧的微透镜阵列;其中,所述多方向背光模组由多方向背光单元为重复单元构成;其中,每个多方向背光单元含有多种不同角度的衍射光栅,所述LCD显示屏包括多个显示图像元区域,每个显示图像元区域含有多个不同方位角的子图像元,所述微透镜阵列由多个呈矩阵式排布的透镜元组成。
检索过程及分析:本案的发明点在于采用不同角度的衍射光栅发出不同方向的出射光从而使集成成像实现多视角。因此从技术领域和技术主题名称出发可以提取关键词“集成成像”,从结构及发明点出发可以提取关键词“衍射光栅”。
本申请是中文申请,首先在Patentics中国申请库中进行检索,采用检索式:“R/公开号ANDB/(集成成像OR衍射光栅)”,浏览了十多页未能发现合适的对比文件。
考虑到本申请是进入中国国家阶段的PCT国际专利申请,并且Patentics的美国申请中文库已经上线,因此考虑在美国申请中文库中进行检索,采用检索式:“R/公开号ANDB/(集成成像OR衍射光栅)”,在第1页第2位快速地得到新颖性对比文件。可见,对于进入中国国家阶段的PCT国际专利申请,可以考虑利用中文关键词在Patentics的美国申请中文库或者其他有中文翻译的数据库中进行检索,提高检索效率。
笔者又尝试在VEN系统中采用CPC分类号G02B27/2214,结合关键词integral imaging、integrated imaging进行检索,也能得到该对比文件,但上述检索式存在一个问题——只是表达了领域和主题名称集成成像的英文,并没有表达本申请的发明点衍射光栅,因此是否有光栅只能通过阅读判断。通读VEN的摘要信息可以发现,该对比文件的摘要中并没有提及光栅(grating),此时在摘要中如果引入关键词grating则会遗失该对比文件,而且如果不阅读全文仅看摘要及摘要附图很可能遗漏该对比文件。该检索过程需要对CPC足够了解以及需要熟悉集成成像的英文表达,否则也容易遗漏该对比文件。反之,由于Patentics对美国申请提供了中文翻译,可以“拿来主义”地直接采用本申请的中文表达“集成成像”“衍射光栅”,保证结果中必然存在这两个关键词,从而快速地得到该对比文件。
案例启示:根据专利申请的特点灵活选择检索数据库,能够提高检索效率。Patentics外文的内置翻译已经上线,其采用神经网络提供了翻译功能,不仅解决了外语阅读带来的外文文献检索困难的问题,还提供了一个连接中文与外文文献的桥梁。
三、利用非技术信息
Patentics检索时,为提高检索效率,通常会利用时间、分类号、关键词等技术信息进行人工干预。而在有些情况下,也可以考虑利用技术信息之外的非技术信息进行人工干预。案例3在检索过程中,利用了非技术信息——行业信息,使其检索效率得到了提升。
【案例3】
权利要求:一种双面插MicroUSBB型公座连接器,其特征在于,包括前铁壳、后铁壳、绝缘胶片、PCB板、主体板以及接触端子,所述前铁壳和后铁壳围合形成容置绝缘胶片、PCB板、主体板以及接触端子的空腔,所述主体板包括上主体以及下主体,所述接触端子包括上端子和下端子,所述上端子一端与PCB板相连,且上端子另一端从上主体引出,所述下端子一端与PCB板相连,且下端子另一端从下主体引出,所述绝缘胶片夹持在上端子与下端子之间,所述上端子与下端子均为接触稳定的铜材5PIN弹片端子,所述5PIN弹片端子以绝缘胶片为对称轴引出到前铁壳中后,前铁壳正反面结构相同。
检索过程及分析:本案检索内容的主题是USB连接器,技术方案为上下结构完全相同,因此可以正反插,本申请给出的技术信息明确,关键词也非常恰当。首先,采用如下检索思路在S系统中进行检索:用H01R和USB限定技术领域,将正反插扩展为“双向OR反向OR双面OR两面OR两用OR正反”,将技术内容扩展为“对称OR相同”,同时对“PCB”进行关键词扩展。但是,在多个中外数据库中都没有得到对比文件。
基于对本领域技术发展的理解,本申请的方案是已应用于市场的技术,因此选择用Patentics再次进行检索。第一次,在Patentics中输入“R/申请号”,前几页未见对比文件;第二次,在Patentics中输入“R/申请号ANDB/USB”,前几页未见对比文件;看到申请人所在地是广东;第三次,在Patentics中输入“R/申请号ANDNS/广东”,在其第1页的第7篇找到了X文件。
案例启示:分析该目标文件,通篇没有出现USB字样,因此无论在S系统中还是在Patentics中检索,但凡有USB的限定就把对比文件全漏掉了。Patentics提供更全面的干预方向,适当调整可能就会获得理想的结果。就本案而言,事后试探“R/申请号ANDB/(对称OR相同)”和“R/申请号ANDB/(双向OR反向OR双面OR两面OR两用OR正反)”两个干预方向,都能在检索结果的第1页获得该对比文件。可见,在Patentics中得到的大部分理想的检索结果都是经过不断调整实现的。Patentics是S系统的有益补充,人工干预方向的正确选取有赖于深入理解发明以及一定程度的检索尝试。如果进行语义检索时检索结果较多,除了利用时间、分类号、关键词等技术信息进行干预,还可以考虑利用技术信息之外的非技术信息进行干预。
四、改写体现发明点的技术手段
技术方案是对要解决的技术问题所采取的利用了自然规律的技术手段的集合,技术手段通常是由技术特征来体现的,一件发明或者实用新型专利申请的核心是其在说明书中记载的技术方案。权利要求或者说明书对技术方案的撰写方式有时比较抽象概括,此时采用Patentics检索效果往往不好,可以考虑改写体现发明点的技术手段,重新撰写能体现发明点的语句进行检索。下面结合案例4进行分析。
【案例4】
权利要求:一种请求处理方法,其特征在于,包括:针对同一请求对应的多种不同操作,按照每种操作的权重大小分别设置各种操作相应权重数量的元素,每个元素对应一个操作,其中,所述对应操作的执行次数对应于所述每种操作占所述请求的权重值;当接收到请求时,从设置的元素中随机抽取一个元素;根据抽取出来的元素所代表的对应操作,对所述请求执行所述对应操作。
检索过程及分析:本案技术方案主要针对现有的硬件负载均衡技术,能够做到将请求平均分配给不同的服务器。但是,在实际应用的很多场景下,并不希望将请求进行平均分配,而是希望对请求按比例或者按权重执行不同的操作。
先在Patentics中采用“R/申请号”或“R/公开号”进行初步检索,未检索到合适的对比文件。关于本案权利要求1的技术特征“元素”,根据说明书中有关负载分配的过程说明,均表明该“元素”不是一个实体,是一个数,这个数可以代表或对应一个操作或实体,当操作的权重值越大,所对应的“元素”个数就越多,从而该操作被抽中的概率就越大,实现负载的不均匀分配。考虑到权利要求技术手段的撰写比较抽象概括,于是对权利要求进行改写,撰写体现发明点的语句进行语义检索:在Patentics中使用检索式:“R/‘负载均衡中根据操作权重大小设置不同个数的元素,元素对应操作,随机抽取元素,权值高的服务器提供较多的服务接入次数’ANDDI/20110811”,可检索到公开了本发明的发明点的对比文件。
案例启示:当采用试探性检索未检索到体现发明点技术方案的对比文件时,可以改写体现发明点的技术手段,根据说明书的内容自己撰写体现发明点的语句并进行语义检索。从权利要求或说明书中提取关键词时,不仅仅要理解该词的字面含义,还要结合本申请的技术方案,理解该词的内涵和外延,从而更加准确理解发明,把握发明点。
五、进行“影子”检索
对于有国外同族的专利申请,或者有国外优先权的专利申请,在用申请本身进行检索效果不理想时,可以考虑采用该申请的同族申请或者优先权作为语义排序的基准在Patentics中进行检索,把同族申请或者优先权看成本申请的“影子”,进行“影子”检索。下面结合案例5对该干预手段进行分析探讨。
【案例5】
权利要求:一种数据接收装置,其特征在于,包括:一数据接收端控制引脚,用于输出一第一控制信号,并接收一对应于所述第一控制信号的一第一响应信号,并接收一第一数据采样时钟信号;至少一个数据接收端数据引脚,用于在所述数据接收端控制引脚接收所述第一响应信号后接收数据;其中,所述数据接收装置使用所述第一数据采样时钟信号对所述接收的数据进行采样。
检索过程及分析:该案要求美国优先权,结合该领域审查经验,预期在美国专利数据库出现对比文件的概率较大。以该案例的中国专利申请号作为排序基准,结合日期过滤,检索式为“R/申请号ANDDI/优先权日”,选中美国申请库和美国专利库两个库进行检索,浏览前2页没有发现合适的对比文件。改用其美国同族申请的公开号作为排序基准,输入“R/美国同族申请的公开号ANDDI/优先权日”,在结果的第1位即找到了好用的对比文件。显然,使用美国同族申请作为语义排序的基准得到了更好的排序结果。
案例启示:在中国申请库中获取该案的中国申请的英文翻译文本,查看其索引并与美国同族申请的索引进行比较。结果显示,该案的中国申请的英文翻译文本与可用的对比文件之间仅有8个索引词完全一致,而其美国同族申请和可用对比文件之间却有10个索引词完全一致。分析发现,中国申请的英文翻译文本的索引不如美国同族申请的索引表达准确。由此可见,检索外文文献应该优先用外文文献号作为排序基准;对于有国外同族的专利申请,或者有国外优先权的申请,可以考虑采用该申请的同族申请或者优先权作为语义排序的基准,在Patentics中进行检索,即进行“影子”检索。
本文结合审查实际案例,介绍了在Patentics中进行检索时的人工干预手段。灵活运用这些手段,能够提高检索质量和效率。当然,Patentics中的人工干预手段还不止这些,这还需要在以后的审查实践中继续丰富。另外,检索系统也不是一成不变的,在检索时可根据实际情况将本文介绍的方法与Patentics的其他命令和功能结合使用,更好地为检索工作服务。
文章来源:中国知识产权报