国双知识智能专家谈:ChatGPT落地到工业领域还有多远? 国双知识智能专家谈:ChatGPT落地到工业领域还有多远?

新闻动态

NEWS

国双知识智能专家谈:ChatGPT落地到工业领域还有多远?

Time:2023-03-28
随着GPT-4的重磅发布,AI应用又一次引爆社交媒体。2022年11月,当OpenAI推出ChatGPT时估计没有想到它后来会如此成功:上线2个月后月活用户突破1亿,成为史上用户增长最快的消费级应用程序。在此之前最为成功的是TikTok,达到这个月活水平也用了9个月。ChatGPT的成功引爆了AI行业,让更多的普通人也开始关注。同时,也引发了众多AI从业者的思考:ChatGPT会对自己所在行业带来什么影响?ChatGPT是否能为我所用?如何用?


作为国双CTO,国双技术战略制定和整体产品研发工作的负责人,刘激扬也在思考这些问题。国双定位为大数据和人工智能领域的技术型公司,人工智能技术在产品和解决方案中得到广泛应用,支撑地位毋庸置疑,上述问题的答案事关国双未来技术布局。



ChatGPT突破在哪里?


刘激扬毕业于清华大学并取得了美国匹兹堡大学计算机科学硕士学位,2014年12月加入国双出任CTO。加入国双前,刘激扬服务于微软长达16年。在微软亚洲研究院工作期间,刘激扬创建了微软搜索技术中心,这也是微软亚洲互联网工程院的前身。他还创立了微软亚洲互联网工程院苏州分院并主持工作。

作为一名技术专家,刘激扬一直非常关注人工智能技术,他在微软的工作就与人工智能技术相关,后来在国双领导了人工智能技术研究。由于这些经历,刘激扬比一般人更懂得人工智能技术的价值和该技术当前的瓶颈所在。

在刘激扬看来,ChatGPT大火并不是因为它采用了颠覆型的技术,更多的是其在现有技术上取得的一种工程突破。

DM_20230327165456_001.jpg

“从技术上来讲,ChatGPT和之前基于深度学习识别猫、狗,仍然处于同一技术路线。因为现在语料的增加、算力的提升、训练相关工程能力的提升,使得更大的模型训练得以实现,也使得表现更为智能。但总体而言,ChatGPT并不是创造了新的技术,而只是原有技术的组合和迭代。”刘激扬表示。

刘激扬介绍,从自然语言处理(NLP)技术本身来看,ChatGPT属于文本生成领域,所用的技术和此前的文本生成一脉相承,目前看来,这样端到端的模型对于分词、语法相关的问题并没有解决,也就是说尚未产生真正的理解,还是基于统计的可能性进行文本生成。

OpenAI公司技术专家的说法证实了刘激扬的看法。根据这些专家们的说法,ChatGPT使用的技术都不是新的,ChatGPT使用的是微调后的GPT-3.5,GPT-3.5是2020年发布的GPT-3的更新版,OpenAI 在2022年1月就发布了GPT-3.5的预览,相关API也早就发布了。因为这些原因,当初OpenAI发布ChatGPT时并没有太多期望,目的只是想收集公众的反馈进行模型优化。

不过,刘激扬认为,ChatGPT还是有突破,它比前辈们更接近人的行为模式,更符合人类的需求。它在人机交互上更为自然、智能,尤其是它能表现出对上下文的理解和记忆,这种体验是此前的各种交互机器人所不具有的,这是一个惊人的进步,也是它能迅速出圈的重要原因。而这背后离不开大量的技术工作,其中的关键创新是ChatGPT采用了一种从人类反馈中强化学习的技术(RLHF),他们先训练了一个会生成各种内容的大语言模型,然后,通过人来教它人类希望它怎么回答来调整,这也是ChatGPT成功的真正秘诀。


落地到行业还有多远?

随着ChatGPT的走红,越来越多的人开始使用它,有人用它来写代码、招聘信息、文案、论文等。不过,目前这些应用主要还是消费领域。那么,ChatGPT能否真正进入行业?

刘激扬认为目前还有困难。ChatGPT主要是面向大众的,这和国双所从事的产业化落地完全不同,那需要在工业领域一个场景、一个场景地深耕。

“前者追求受众广泛,能够满足大多数人的一般需求,后者需要强化数据和知识双轮驱动,针对业务问题进行数据治理、知识治理、智能应用构建,结合专家的经验、数据及知识、智能决策算法,解决核心业务问题。”他说。

刘激扬认为,ChatGPT(或者类似的大模型)要落地到行业、赋能企业目前至少还面临以下挑战:

首先是答案的正确性。ChatGPT采用的大模型技术,数据主要来自网络,其本身并不存在真正的基础数据库、知识结构,在回答问题时它会犯错,甚至虚构,导致它常常“一本正经的胡说八道”,这对寻求专业性问题答案者会产生严重困扰。

其次,ChatGPT使用的大模型本质上是一种“黑盒子”,对于为什么给出这样的答案,ChatGPT无法给出解释。这在很多工业应用场景来说是不可接受的,很多时候我们不仅想知道答案,还希望知道为什么是这个答案。

第三是工程难度,也就是成本问题。ChatGPT采用的大语言模型,模型参数达到千亿级别。训练这种模型需要很大投入,有机构预测,GPT-3训练一次的成本约为140万美元,同时平时还需要不菲的运行费,显然不是一般的企业能够玩得起的。

另外,还有实时性的问题。目前英文版本的ChatGPT数据截至2021年,而中文版本的ChatGPT数据截至2020年,数据滞后的主要原因是由于语言类大模型的技术限制。而在很多工业场合,需要结合最新的数据做出决策,这一点也是难以接受的。


好的技术需要积累和打磨

虽然ChatGPT要真正落地行业还有一段距离,但它的成功让人们再次看到了人工智能技术的前景,尤其是生成式AI技术,刘激扬也在评估生成式AI技术在国双应用的前景。

刘激扬表示,国双所从事的行业非常需要生成式AI技术,比如知识管理就是其中之一。目前国双与某勘探开发研究院合作的知识智能管理平台,可以向科研人员提供文章内容摘要、问答、搜索和推荐,但缺少像ChatGPT这样的自然对话能力,接下来会重点研究这一领域。

另外,国双所从事的工业领域对答案正确性和实时性都有严格要求,目前单靠ChatGPT难以满足,但可以考虑通过其他技术的结合来弥补,比如与知识图谱相结合,国双也会研究生成式AI与其他AI技术的融合。

刘激扬坦言,让AI落地行业需要与行业深度结合,这需要长期积累,需要精心打磨产品,需要时间。“ChatGPT能有今天的成功,是几十亿、上百亿的投入,是连续八年默默无闻的改进、优化才有的,没有这份坚守的决心也不能有今日的成功。”他说。

对于这份坚守国双深有感触,国双也是这么走过来的。国双成立于2005年,第一个产品Web Dissector(互联网流量和用户行为监测与分析系统,以下简称WD)是2008年推出的,其早期的功能主要是网络流量和用户行为的统计、分析。为了满足客户在使用中不断提出的新需求,国双开始将AI技术应用于WD,并不断优化,因此其功能也从后台的全域营销监测拓展到前端的广告预算分配等。

国双与兰蔻的合作案例至今仍为老国双人津津乐道。兰蔻是国双创业初期的天使客户,当时想了解自己品牌在中国各地的认知度。传统方法是找人在全国进行面访和问卷调查,但这样做周期长、成本高,准确性也无法考证。于是,兰蔻决定运用大数据的方法进行分析,并把这件事委托给了国双。国双先是准备了一些关键字列表,然后利用WD收集通过搜索引擎查询这些关键词的流量以及访问兰蔻官网的流量,最后进行汇总分析,结果发现上海、北京、广西位列前三。广西的上榜让人意外,国双又做了进一步的深究,最后发现有人借助搜索引擎在作弊,骗取广告费。最终,国双经过与客户沟通运用大数据技术帮客户避免了不小的损失。

在上述案例中,国双行业专家的经验发挥了很重要的作用,但毕竟还是需要人工介入。于是,国双开始研究如何把这些专家经验融入WD,通过WD来自动识别异常流量,机器学习技术就是这样被引入进来。在与作弊者的不断较量中,国双一直在不断优化和改进,如今,已经形成了基于机器学习的系列产品。

“国双并非一家很大的公司,资源有限,我们不会盲目地去搞技术,更多地投入都是从客户那里看到行业、市场和需求。我们一直强调场景化落地,也就是帮助客户解决实际问题,过去如此,面对大热的ChatGPT也是如此。我们不会盲目抄作业,能否利用它来真正解决行业痛点是最重要的标准。”刘激扬表示。



TOP
数字化、智能化转型一站式平台
企业级大数据和人工智能解决方案提供商
如您需要我们的帮助,请留言给我们:
*姓名:
*电话:
*公司:
*邮箱:
*内容:
*验证码:
验证码