新闻动态
NEWS
国双知识智能平台:让知识真正成为力量(上)
英国的哲学家弗朗西斯·培根的名言“知识就是力量”大家耳熟能详。这句话告诉我们,当我们获得知识,再通过思考就能解决以前所不知道的很多问题。然而,随着数据量的爆炸性增长,如何从浩如烟海的各种知识中获得真正需要的成为一件非常困难的事情。同时,把已有的知识汇聚和保存起来也越来越困难。在此背景下,人们不得不借助各种工具。国双知识智能平台正是用来解决类似的问题。国双知识智能平台借助自然语言处理、知识图谱、深度学习等各种人工智能技术,大大提升了知识沉淀、搜索、应用的效率和效果,真正让知识成为企业向智能化转型的驱动力,以助力企业业务创新与发展。
知识获取难度不断攀升,大量隐形知识遗失
明知公司有相关数据和资料,但是却不知道到哪里去找?这是很多人常常面对的难题,越是大型企业这个问题就越突出。因此,为了找到需要的数据和资料,人们不得不花大量时间和精力。随着知识增长速度加快,知识密集领域工作强度、难度日益加大,业务创新越来越困难,知识获取难已成为重要的制约因素之一。这主要体现在以下几个方面:
收集、对比资料占用时间越来越多,工作繁重。众所周知,企业经过多年发展,通常会建立起多个系统,信息散布在这些系统中,要从中查询、比对非常费时。同时,日常工作需要用到的规范、指南等常年积累也成为工作中不可忽视的“耗时”任务。据全球知名学术出版集团爱思唯尔一份名为《科研的信任》的研究报告称,全球研究人员搜索期刊文献的时间几乎和他们阅读文献的时间一样多。研究人员每周搜索研究文献的时间超过4个小时,而阅读这些文献的时间则超过5个小时。随着时间的推移,查找文献的时间还在逐年增加。
特定领域的宝贵经验没有被推广、传承,难以复用,隐形知识遗失。当今企业员工流动性加快,随着员工离职和退休,特别是专家离任,很多经验没有传承下来。
不同项目、不同部门、不同业务线、不同成员之间的知识和经验没有共享和复用。新员工加入,学习成本高。
“我们很多知识智能平台的客户一个常见痛点是,很多资料分散在个人电脑和网盘里,没有归纳和总结,分享也很困难。” 国双知识图谱产品技术总监刘飞欧表示。
国双知识图谱产品技术总监刘飞欧
当下市场竞争日趋激烈,新成果、新技术出现频率明显加快。同时,各种规范、标准的更新也越来越频繁,这一切都进一步增加了信息量,增加了检索和利用的难度。
刘飞欧用“收集难、检索难、使用难”来形容当下知识工作者面临的挑战。为了应对这些挑战,有些企业也做了努力。比如,对现有系统进行集成,并基于此构建门户、搜索引擎,从而大大减少资料查找时间。然而,这种解决办法依然具有很大局限性:其一是不够智能,不能准确找到所需资料。一个典型例子就是如输入“苹果”,返回的结果很可能既有作为水果的苹果也有手机苹果,其无法理解使用者到底要找什么。其次,没有解决隐形知识的收集问题。第三,缺乏专门的工具,知识更新困难。
知识图谱等AI技术破解知识获取难题
人工智能的进步让人们看到了解决问题的希望,特别是知识图谱、自然语言处理等技术的成熟,可以帮助人们比较容易地实现数据知识化、结构化、标准化,并为后面的共享和复用打下基础。
知识图谱是Google于2012年提出的一种用图模型来描述知识的技术,用于表示世界万物的关联关系。它可以描述客观形态,如设备与设备、数据与数据之间的关联等;也可以表示客观事实,比如空气的成分中有氧气;还可以用来表示流程性逻辑,比如工作流程、实施步骤等。知识图谱可以沉淀显性知识,也可以通过知识编辑沉淀隐性知识。
“知识图谱是一种非常好的技术,一方面是可以很方便地让人们找到所需要的信息;另一方面是可以很容易地把知识汇集并很好地组织起来,通过这种方式让碎片化的知识沉淀下来。”刘飞欧表示。
当然,一个真正好用的知识智能平台不仅有知识图谱技术,还涉及其他人工智能技术。比如,国双知识智能平台就应用了包括NLP、知识图谱、机器学习、深度学习等在内的诸多人工智能技术,基于它们形成模型构建、数据标准、知识抽取、计算和应用的完整工具链,实现了从数据到知识、到应用、再到优化的全生命周期管理。
国双知识智能平台的构建最早开始于2017年左右,刚开始从司法领域起步,用于对司法文书和案例的汇集和整理,在此期间打磨出了自然语言处理的一些工具集,包括标注、抽取等,并形成了一个文书解析的平台。后来,这个平台经过了油气行业的锤炼,用以对生产数据(主要是数值数据)进行分析和处理,不久这个平台又经过了政府大数据项目的历练,对知识图谱的应用得到进一步完善。等到2021年,国双知识智能平台落地某勘探设计研究院进一步打磨,不管是平台本身还是周边的工具都已经趋于成熟。
国双知识智能平台的打磨过程中,其背后一支高水平的数据科学团队尤为值得一提。这个团队成员来自于清华大学、北京大学、哥本哈根大学等国内外重点高校,精通机器学习、深度学习、自然语言处理等人工智能技术,在数据挖掘及智能分析、知识图谱及智能应用构建等方面积累了丰富经验,他们先后研发出了600多项人工智能专利,为国双产品的技术领先性提供了可靠保障。
国双的人工智能技术也得到了行业的广泛认可。2018年,在由中国司法大数据研究院(最高人民法院智慧法院重点实验室)联合多方举办的 “中国法研杯”司法人工智能挑战赛上,国双荣获第一名,并于2019年被邀约为大赛评委。2019年12月,国双还荣获信通院知识图谱基础能力测评第一名。另外,国双还荣获2020年“中国智能科技最高奖”吴文俊人工智能科技进步奖。这些成绩也进一步证明了国双知识图谱、自然语言处理、深度学习等技术的领先性。