人工智能热点算法之用户画像相关专利申请保护现状及审查规则解析

来源:优秀文章 发布时间:2023-01-22 点击:

郭永强

用户画像也被称为用户多维分析,是获悉用户真实需求和指导企业产品设计的重要工具,它在很大程度上体现了用户的真实特征和业务诉求。用户画像本质上是现实用户在网络世界中的虚拟代表,是表达用户需求和指导产品设计方向的重要工具。

构建画像的主要流程就是以用户自身属性和在互联网上的交互数据为数据基础,通过建模或统计分析得到用户特征再映射到业务标签上,从而形成用户画像。目前用户画像在诸多领域都有广泛应用,例如:产品设计、信息检索、推荐系统、风险控制、精准营销等①常乐.基于用户行为分析的用户画像系统设计与实现[D],北京邮电大学硕士论文,2020 年.。

随着用户画像的广泛应用,其相关专利申请量也出现了大幅增长。

涉及用户画像的发明专利申请呈现出两个主要类型。一类是涉及用户画像本身的构建方法;
另一类是涉及用户画像在各个领域的应用。由于这两类申请的解决方案中经常均会涉及算法特征以及商业规则和方法特征,因此,该领域的发明专利申请如何才能构成专利保护的客体成为企业界、实务界乃至学术界热议的焦点问题。

(一)国内外专利申请态势

1.专利申请趋势

笔者围绕用户画像对中国专利摘要数据库、美国专利全文数据库、欧洲专利全文数据库、日本专利全文数据库、韩国专利全文数据库进行了检索,检索截止时间为2021 年10 月。

参见图1,根据从上述数据库获取的专利申请数据进行分析,可以发现:全球在2010-2021 年围绕该领域的申请量呈现出上升趋势,特别是在2019 年增长最快,比2018 年同期增长了1.5 倍,并在2020 年超过了2,400 件。

图1 全球用户画像领域发明专利逐年申请量趋势图

国内用户画像相关专利申请量也同样呈现出逐年增长的趋势,同样是在2019 年出现爆发式增长,申请量接近2018 年的3 倍。正是由于中国用户画像相关专利申请量的快速增加,带动了五局整体的快速上升趋势。特别是在2020 年,我国申请量超过了2,100 件,参见图2。

图2 中国用户画像领域逐年申请量

2.五局申请量对比

从中国、美国、欧洲、日本和韩国五局围绕用户画像的专利申请量来看,参见图3,中国在用户画像领域的专利申请量(5,761 件)居于第一,美国(802件)居于第二,日本(209 件)居于第三,欧洲仅有美国的八分之一,中国的五十分之一,韩国占比最少。

图3 用户画像领域五局申请量分布

3.重点申请人分布

全球用户画像相关专利的各申请人的申请量从高到低次为:腾讯、百度、平安、阿里巴巴、京东、深圳壹账通、北京三快、北京达佳互联、奇虎、北京奇艺世纪,参见图4。

图4 用户画像领域申请量前10

可以看出,自2010-2021 年,国内在用户画像相关申请比国外活跃,前10 名全部来自国内;
在五局中,中国相关申请量占据明显优势。

4.中、美、日局授权率对比

图5 是中、美、日三局关于用户画像领域的授权率对比图。可以看出,日本、美国在用户画像领域的专利授权率分别为46%和43%,明显高于中国用户画像领域的授权率10%。

图5 中、美、日局用户画像领域授权率对比图

从这点可以反映出,用户画像领域的专利申请在中国较难获得专利权。这与我国在该领域明显处于领跑地位的专利申请量形成了鲜明的对比。

(一)现有审查规定

如上所述,用户画像相关发明专利申请的特点就是权利要求的方案中包含算法特征或商业规则和方法特征,而算法特征以及商业规则和方法特征因不属于技术特征,故而,当技术特征和非技术特征交织在一起时,容易给方案是否构成专利保护客体的判断带来难点。

《专利审查指南》第二部分第九章第6.1.2 节规定:对一项包含算法特征或商业规则和方法特征的权利要求是否属于技术方案进行审查时,需要整体考虑权利要求中记载的全部特征。如果该项权利要求记载了对要解决的技术问题采用了利用自然规律的技术手段,并且由此获得符合自然规律的技术效果,则该权利要求限定的解决方案属于专利法第二条第二款所述的技术方案。如果权利要求中涉及算法的各个步骤体现出与所要解决的技术问题密切相关,如算法处理的数据是技术领域中具有确切技术含义的数据,算法的执行能直接体现出利用自然规律解决某一技术问题的过程,并且获得了技术效果,则通常该权利要求限定的解决方案属于专利法第二条第二款所述的技术方案。

上述规定强调了对于包含算法特征或商业规则和方法特征的新领域、新业态相关发明专利申请,如果上述算法特征或商业规则和方法特征能够与技术特征一起,或者能够使方案整体上解决技术问题,那么也可以构成技术手段的一部分。特别是,对于改进在于算法的解决方案,如果该解决方案涉及的算法特征能够体现出其具体的应用领域,并且能够解决该领域中的技术问题,例如,该解决方案中算法处理的数据是诸如图像领域中的像素或视频、通信领域中的代码、语义解析过程中的文本或词句,亦或是其他具体领域中的技术问题,并且,权利要求中的算法各步骤要能体现出解决该技术问题的具体过程,那么,该解决方案能够构成技术方案。

下面,笔者将结合两个案例,从正反两方面介绍上述审查规则的具体适用方式。

(二)典型案例

1.案例1:一种电力行业的用户画像构建方法

【案情概述】

目前,电力行业普遍是构建用户价值细分体系,得到不同价值的用电客户后,再根据某些定量的指标提供增值服务。然而,这样的方法存在以下缺点:没有将定性数据和定量数据相结合,得到的结论的可解释性不高,从而不能清楚、全面地描述用户行为的具体特征。

为此,该申请提出了一种电力行业的用户画像构建方法,将电力行业的用户行为的频度、程度、近期预测相结合,能够多方位描述不同属性的用电客户的行为特征,从而有效辅助电力公司的业务人员根据用电客户的情况提供差异化增值服务。

【权利要求】

1.一种电力行业的用户画像构建方法,其特征在于,包括:

根据数据库中的字段生成用户的基本属性标签,其中所述用户的基本属性包括地区、电压等级、行业、用电类别、入网时长、是否为高耗能、是否为三方用户;
和/或

基于用电行为、缴费行为和交互行为分别生成用户的基本行为标签;

基于所述用电行为生成用户的基本行为标签包括:

基于安全用电行为、异常用电行为、变更用电行为、正常用电行为分别构建用户的二级行为标签体系;

基于所述安全用电行为构建用户的二级行为标签体系包括:

生成用以描述所述安全用电行为的二级行为标签,申请文件以及审查过程

其中,所述用以描述所述安全用电行为的二级行为标签包括:用电设备安全性高、用电设备安全性低、用电安全管理能力高、用电安全管理能力低;

所述用户画像构建方法还包括:生成用以描述所述用电设备安全性高/低的三级行为标签,

其中,所述用以描述所述用电设备安全性高/低的三级行为标签包括:频繁出现安全隐患、偶尔出现安全隐患、从不出现安全隐患、曾出现严重安全隐患、未曾出现严重安全隐患、潜在安全用电风险低和潜在安全用电风险高;

生成用以描述所述用电设备安全性高/低的三级行为标签包括:

从用电检查表中获取用户近三年安全隐患总次数,并计算相应的近三年安全隐患频率;
若所述近三年安全隐患频率高于行业月平均安全隐患频率,则生成所述频繁出现安全隐患的三级行为标签,否则生成所述偶尔出现安全隐患或 所述从不出现安全隐患的三级行为标签;

根据所述用电设备的安全隐患类型生成所述曾出现严重安全隐患或所述未曾出现严重安全隐患的三级行为标签;

从所述用电检查表中获取用户近三月安全隐患总次数,并计算相应的近三月安全隐患频率;
若所述近三月安全隐患频率高于预设频率阈值,则生成潜在安全用电风险高的三级行为标签,否则生成潜在安全用电风险低的三级行为标签。

【案例分析】

权利要求1 涉及一种用户画像构建方法,该方法所要解决的问题是当前电力行业不能清楚、全面地描述用户行为的具体特征。为解决上述问题,该申请所采用的手段是通过人为设定的属性信息和用电行为、缴费行为和交互行为来描述客户的特征以构建用户画像,上述手段中用于描述用户属性信息、用户行为信息的具体指标仅仅是人为设定的用户画像的信息表达方式,各级指标的设定也是人为设定的画像构建规则,并非遵循自然规律的技术手段。因而,该申请未采用遵循自然规律的技术手段解决技术问题,所获得的多方位描述不同属性的用电客户的行为特征,从而有效辅助电力公司的业务人员根据用电客户的情况提供差异化增值服务的效果,不属于技术效果。因此该申请的解决方案不属于专利法第二条第二款规定的技术方案,不构成专利保护的客体。

虽然可能也有观点会认为:该申请通过根据数据库中的字段生成用户的基本属性标签,并非依赖人为定义的标准来达到发明目的,对用户的基本属性和基本行为的确定是需要大数据的采集和分析才能实现的,是技术手段。对于用户具体对应哪种基本行为标签的确定过程,是需要预设公式对获得的用户数据进行计算,根据计算结果才确定,并不能通过人为定义的方式直接确定,其本质是通过计算机程序对获得的数据按照预设规则进行处理,最终输出计算结果存在可遵循的自然规律,并不受到人的思维的影响。

对此,笔者认为,虽然权利要求所限定的方案记载了可以使用数据库等数据处理手段,但是数据库的使用并不能直接构成技术手段,该申请的解决方案并不涉及数据库技术中有何技术问题需要解决,而仅仅是利用数据库的数据存储的固有功能。其次,虽然该申请也可以通过计算机来运行预设公式计算获得结果,但利用计算机进行数据处理仍是计算机固有的数据处理性能,利用计算机进行电力行业用户画像数据的存储、处理,与计算机运行其他应用程序一样,计算机作为程序的执行载体,其硬件结构或内部性能不会发生任何技术上的改变。因而,即便该申请的方案中记载了数据库等手段,但整体上分析可知,该申请请求保护的用户画像构建方法仅仅是对于电力行业用户画像的简单信息表达,并未解决电力行业中的技术问题,所设定的画像构建规则并非遵循自然规律的技术手段,无法获得技术效果。因此,仅针对某领域通过设定画像构建规则而未能解决任何技术问题的申请,难以获得专利保护。

2.案例2:一种基于对话交互的画像构建方法

【案情概述】

现有的用户画像方法主要是通过大数据统计分析对用户画像进行构建,用户的属性标签通过对日志信息关键字段的提取来获得。通常有两种方式:一种是,存储用户的日志信息,当用户日志信息达到设定阈值后,根据静态日志构建用户画像;
另一种是,保存用户日志,在一定时间窗口内遍历所有用户日志,根据某种权重衰减函数计算得到最新的用户画像。第一种方式应用的最普遍,然而忽略了用户属性或偏好随时间改变的性质,使得越到后期对用户画像的刻画越不准确;
第二种方式虽然考虑了时间因素,但推进时间窗口需要积累用户日志,使得更新缺乏实时性,而且不同的时间窗口设定会影响用户画像的效果,调节参数复杂困难。

针对现有技术存在的上述不足,该申请提出了一种基于对话交互的用户画像的构建方法,通过语义解析器对用户的输入进行实时解析,并根据解析到的用户语义对各个属性的权重的加权分布进行更新,从而生成准确细致的画像。

【权利要求】

1.一种基于对话交互的画像构建方法,其特征在于,通过语义解析器对用户的输入进行实时解析,并根据解析到的用户语义对各个属性的权重的加权分布进行更新,从而生成准确细致的画像;

所述的语义解析器,根据任务需求设计用户画像中的属性标签构建得到,具体步骤包括:

1)建立领域相关数据库或知识库,不同领域的信息分类存储和分析;

2)对于所有基础属性和每个独立领域,分别构建语义解析器,最终将各个语义解析器贯通,得到完整的语义解析器;

所述的属性标签包括基础属性和领域属性;

所述的基础属性包括:姓名、性别、年龄、电话、家庭住址和公司地址;

所述的领域属性包括:常去目的地、常听的歌和常拨的号码;

所述的语义解析器采用槽值对的方式表示语义,其中:槽即为属性标签的名称,值即为该属性标签对应的值;
所述的用户的输入包括:语音、文字或手势;

所述的实时解析,是指解析语义的过程是实时的,即每得到一次用户的完整输入时,对该次用户输入作语义解析;

所述的实时解析除了解析当前对话输入,还需对上下文对话逻辑进行解析,并且采用语义资源定制的方式构建语义解析器;

所述的更新,包括更新基础属性的值和领域属性的值;

在更新基础属性和领域属性的值时,进行权重和衰减因子处理;

所述的权重和衰减因子处理是指:首先设定时间窗口T,在该时间窗口内,时间越近的权重越高,含有衰减因子的权重计算公式为:wAki =e-p(t0-t),(略);

所述的基础属性的值,通过以下方式实现更新:设定时间窗口T1,(略);

所述的领域属性的值,通过以下方式实现更新:设定时间窗口T2,(略)。

【案例分析】

权利要求1 请求保护一种基于对话交互的画像构建方法,其所要解决的问题是通过语义解析器对用户的输入进行实时解析,降低参数调节复杂性,这属于技术问题。为解决上述技术问题,该申请所采用的手段包括对用户输入的语音、文字、手势进行语义解析,将语义解析后的属性值的权重计算和分布更新,而语音、文字、手势等是自然语言和图像识别领域常用的技术数据。该申请权利要求1 中不仅提及了用户输入是语音、文字等,算法各步骤也紧密围绕如何对输入的内容进行解析,并如何对解析后的属性值对属性标签进行更新的具体过程,也就是说,该申请记载的算法特征处理的数据是技术领域中具有确切技术含义的数据,且权利要求中涉及算法的各个步骤体现出与所要解决的上述技术问题密切相关,算法的执行能直接体现出利用自然规律解决上述技术问题的过程,该申请所获得的相应的效果属于技术效果。因此,该申请请求保护的解决方案构成专利法第二条第二款规定的技术方案,属于专利保护的客体。

通过对用户画像领域专利申请的国内外申请现状以及国内外授权情况的对比分析,可以看出,我国在用户画像领域的专利申请量和申请热度方面具有优势,但是,依照目前审查规则,对该领域的客体审查方面还较为严格。

在审查实践中,应该客观分析方案中涉及的算法特征或商业规则和方法特征,当它们能够整体上使发明解决技术问题时,应承认其作为技术手段的一部分,并在创造性评判过程中认可其有可能对发明带来的技术贡献。不能武断认为算法改进的解决方案就一概不能获得专利保护,这样会打击创新主体对于人工智能热点算法的研发热情,不利于人工智能产业落地和发展,更不利于新领域、新业态创新成果的保护和应用。

在申请实务中,应该正确理解审查规则和适用,在撰写用户画像等人工智能领域热点算法改进的发明专利申请时,应在申请文件中写明算法的具体应用领域,不涉及具体应用领域的,应写明是否涉及计算机内部性能的改进,算法处理的对象是否为技术领域中具有确切技术含义的数据,权利要求记载的方案中,应写明算法各步骤用于解决某技术问题的具体过程,而并非仅在权利要求的主题名称或数据处理来源中表明该申请的应用场景或数据来源。

专家点评

人工智能在产业界落地的过程中,围绕其应用层面的算法相关发明专利申请日渐增多。以协同过滤、社区发现、知识图谱、用户画像、差分隐私等为代表的算法改进解决方案层出不穷。本文紧密围绕“用户画像”这一热点申请,通过对比五局专利申请态势和审查结论差异,能够让读者直观感受到我国在专利申请数量上的优势和授权率方面的劣势,进而通过用户画像领域两件典型示例,为读者解析了为何单纯的画像构建方法难以获得专利保护,而现有规定中的“具有确切技术含义的数据”在客体判断时如何具体适用。最后,本文在结束语中围绕审查实践和代理实务,给出了意见和建议,有助于促进专利审查和申请质量共同提升。

猜你喜欢 画像专利申请语义 真实场景水下语义分割方法及数据集北京航空航天大学学报(2022年8期)2022-08-31从一件无效宣告请求案谈专利申请过程中的几点启示和建议军民两用技术与产品(2022年6期)2022-08-06威猛的画像小哥白尼(神奇星球)(2022年3期)2022-06-06“00后”画像新世纪智能(高一语文)(2020年9期)2021-01-04画像非公有制企业党建(2020年10期)2020-10-27唑啉草酯中国专利申请分析农药科学与管理(2019年9期)2019-11-23韩国AI内容专利申请数5年激增10倍中国知识产权(2018年7期)2018-07-31专利申请三步曲发明与创新(2016年5期)2016-08-21“吃+NP”的语义生成机制研究长江学术(2016年4期)2016-03-11情感形容词‘うっとうしい’、‘わずらわしい’、‘めんどうくさい’的语义分析人间(2015年21期)2015-03-11推荐访问:热点 专利申请 人工智能
上一篇:全面导师组制度下提升大学生党建工作的思路探究——以山东省某大学建筑与城乡规划学院建筑学专业为例
下一篇:生态修复视角下的广通河水环境综合治理研究

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有