国双出席大数据产业峰会并荣获“中国大数据应用最佳实践案例”

【发布时间:2017-04-01】

  3月28至29日,在工业和信息化部的指导下,“2017大数据产业峰会”在北京国际会议中心召开。国双助理总裁、司法大数据事业部总经理石鹏应邀出席此次峰会,并在「中国大数据应用最佳实践案例论坛」上,发表了题为“大数据提升知识产权司法保护能力——以业务中心形成数据中心、以行业资源推动数据互联”的演讲。此外,国双的“大数据助力企业击穿消费决策第一环”和“大数据助力知识产权案例指导制度建设”两个案例,凭借深度剖析大数据在数字营销和司法领域的应用,具有较强的行业带动性,而荣获“中国大数据应用最佳实践案例”。

 

国双助理总裁、司法大数据事业部总经理石鹏发表演讲

 

  国双自2005年成立以来,一直专注于数据的收集、检索、分析和高速处理,自主研发了多项应用,并长期着力于司法领域的专业建设。区别于以往的通用类的政务数据服务,国双在一个垂直领域内作专业深耕,并取得了非常好的成效。石鹏在演讲中分享了国双在司法大数据领域的案例与思考。他指出,国双能够具有专业化的深耕能力,是因为培养了自己的领域专家,做到了以业务中心形成数据中心、以行业资源推动数据互联,并且实现了以核心数据汇聚跨行业资源。

 

国双荣获“中国大数据应用最佳实践案例”

 

  石鹏介绍:在服务于司法实务的核心数据库建设完成后,国双与腾讯携手,围绕“精知例点”平台本身及知产审判的相关业务展开了一系列的合作。核心数据跨行业应用,所产生的新的价值,又吸引了国双另一位合作伙伴人民法院出版集团再次投入力量,再次进行资源整合。凭借国双深厚的司法数据基础和对业务的深入理解,结合腾讯云强大的计算资源支持,以及人民法院出版集团的行业资源,一定会在智慧法院场景挖掘出更多、更有价值的颠覆性创新应用。

 

以下为演讲内容摘要:

  去年,我们为最高人民法院知识产权案例指导研究(北京)基地承建了“精知例点”平台,并与人民法院出版社合作建设了“法信”平台,得到了周强院长一年两评,我们感到很自豪。“精知例点”平台将在今年4.26世界知识产权日前后正式上线运行。

 

  在项目建设过程中,我们有很多的思考与经验总结。我们能够在司法领域做专业深耕,是因为:我们不仅将自然语言等大数据处理技术加以专业化的应用,并且我们将领域内的全量数据,以及最为珍贵的审判业务经验、转化为数据语言,融合并复刻在了我们的数据平台上,这是前所未有的尝试。我们能够具有这种专业化的深耕能力,是因为我们培养了自己的领域专家,做到了以业务中心形成数据中心、以行业资源推动数据互联。

 

 

  以“精知例点”平台为例,“以业务中心形成数据中心”的含义是:我们建设数据中心的前提是理解这个行业,理解这个行业的核心业务。“精知例点”平台就是一个业务规范的伴生性系统,是因司法改革的需要和知识产权审判的需要而产生的。

 

  这个平台完全是通过与知产法官和行业内其他专家的深度交流,从业务需求而来的,它的定位就是用成熟的大数据技术和自然语言处理技术,去支撑专业的业务需求,服务于知产法律领域的各类主体。

 

  它类似于一种工具,服务核心业务,提供最必要且易用性高的解决方案。所以他从业务出发去做数据构架、串联,以业务为本汇聚数据,处理数据,输出数据。我们要强调的是,如此构建的数据中心,无论从底层构架,业务逻辑,应用展现等诸多方向,都是扎实的,不是为了机械地数据汇聚而汇聚。

 

  “精知例点”平台刻画的是知产审判案例指导的业务经验,简单来说就是,一是圈定有指导意义的先例范围,以及明确先例指导的具体针对事项,二是让特定的人检索出符合效力等级的最适合的先例,三是记录和可视化展现先例的遵循、参考等情况。

 

  我们的平台能够识别和收录案件文书,是否对前案进行了遵循,能够辅助先例生成和先例规则的提取;能够按照当事人的口语化案情描述,或者一段完整地诉讼材料,根据法院管辖和审级关系来确定法官、当事人应当适用或者应当参考哪一个先例;能够展现先例规则在全国各级法院被遵循或者被修改的演进关系。

 

  这个平台对业务刻画得非常深,因此也投入了与之能匹配的细腻的数据处理能力;是专业人员的精致加工与自然语言处理,以及机器算法的非常好的融合。可以说,这个平台所展现的数据处理能力是目前我国其他的法律类检索数据库达不到的。

 

  那么第二个标题“以行业资源推动数据互联”在“精知例点”平台上是怎么体现的呢?首先,我们认为一个行业内的数据是有相互粘性的,行业内的分类数据之间是可以流动的。这些数据之间粘性大小取决于业务细分之间的关联性是否紧密。

 

  基于此,我们不仅要在分类数据之间建立关联,直接加以处理利用,更要促进分类数据之间的流动。我们使这种数据流动具有方向性,业务核心数据汇聚、所产生的向心力会影响关联渠道中数据流动的方向,并且我们从业务逻辑和使用逻辑上推动、引导数据流动,从而产生和发现更多的价值。

 

  打个比方,知产领域里面除去法院外有很多细分的部门、单位,比如专利局、工商总局、专利复审委、商评委、版保中心、各类知产媒体等等。各单位都留存和产出一些细分数据:比如授权数据、裁文数据、行业数据和知识库数据等等,这些数据都将按照粘性的大小,逐渐通过我们建设的数据管道,向知识产权保护的终端——知产法院的业务系统汇集、并相互流动。

 

  在这个过程中我们特别有体会的是:一是尽可能的把关联性清晰的原始数据迅速汇集,打通数据管道之后,数据流动会产生向心力;二是要凝练行业内核心业务、核心主体的刚需,搭建新型的数据化应用或者工具,并与上面的内容结合。逐渐丰富数据种类,培养次生数据,推动、引导数据融合,产生价值。针对上述提到的分类数据,我们在以一种近乎排列组合的方式形成新的数据应用价值。

 

  在这里,我想在前两个标题之外再补充一点,就是“以核心数据汇聚跨行业资源”。同样以我们建设的知识产权“精知例点”平台为例。知识产权保护作为:保障国家经济运行,支持双创和国际化交流的重要一环,不仅吸引了国双在司法产品业务上进行深耕和投入,同样也吸引了其他跨行业主体的投入。

 

 

  在服务于司法实务的核心数据库建设完成后,国双与腾讯携手,围绕平台本身及知产审判的相关业务展开了一系列的合作:一是我们正在测试“精知例点”平台的线上咨询互动视频场景,二是我们在为平台设计、升级语音服务的同时,我们与腾讯共同打造出了庭审语音转写产品。我们合作的产品在业务深度上具有不可比拟的优势,成为了继科大讯飞、阿里之后第三家可以向司法系统成规模、成建制提供该项服务的建设力量。

 

  核心数据跨行业应用所产生的新的价值,又吸引了国双另一位合作伙伴人民法院出版集团再次投入力量,再次进行资源整合,会产出更有吸引力的应用,这种行业顶尖代表的强强联合得到了最高人民法院的高度关注。

 

  我们相信,凭借国双深厚的司法数据基础和对业务的深入理解,结合腾讯云强大的计算资源支持,以及人民法院出版集团的行业资源,我们一定会在智慧法院场景挖掘出更多、更有价值的颠覆性创新应用。而这一切,已经远远超出了“精知例点”平台本身的业务含义。

 

  我们一切的故事,以一个数据中心开始。

 

  感谢最高人民法院陶凯元副院长,最高人民法院民三庭庭长宋晓明,北京高级人民法院杨伯勇专委,北京知产法院宿迟院长和知产领域法官、专家对平台建设的支持和智慧投入。在各位专家的领导下精知例点这个平台才得以顺利的建设,法官们在整个建设中无私地投入了大量智慧和心血。