中共陕西省委党校(陕西行政学院)
摘要:人工智能技术在近年来的发展中已经取得了举世瞩目的进展,技术既影响了普罗大众的生活,也给前沿的科学探索拓展了新的空间。不同于人脸识别、自动驾驶、蛋白质结构预测等AI应用,ChatGPT带来的改变不仅仅是知识储备丰富、语言流畅的聊天机器人,更是催生AIGC人工智能产业链的商业化提供了更多的机会和发展思路,引爆新一轮人工智能应用场景的爆发式增长。
关键词:ChatGPT;AIGC;人工智能;爆发式增长;
一、ChatGPT催生AIGC产业链
(一)ChatGPT与AIGC
AIGC(Artificial Intelligence Generated Content,即生成式人工智能)是通过人工智能技术生成绘画、文本、音乐等内容的技术,基于大型预训练模型等方法,通过已有数据的学习和识别,生成相关内容的技术;ChatGPT(Chat Generative Pre-trained Transformer即生成预训练转换器)是文本型生成,相比传统聊天机器人,其功能要丰富得多,不但能生成文字,还能生成代码、数学公式。
AIGC和ChatGPT是两种不同的人工智能技术,前者是一种基于人工智能和数据中心基础设施的新型技术,后者则是一种基于自然语言处理的智能对话技术。虽然这两个技术看似没有直接联系,但它们都代表了人工智能技术发展的新趋势。ChatGPT是一种特定的AI模型,由OpenAI开发,专注于理解和生成人类语言,是AIGC领域的一个子集。
(二)ChatGPT催生AIGC产业链
AIGC技术是一项潜力无限的技术,但是并不简单。以ChatGPT为例,GPT⁃3训练一次的成本约为140万美元;对于一些更大的LLM模型采用同样的计算公式,训练成本介于200万美元至1200万美元之间。潜藏在巨大成本之下,还有众多人工智能科学家和工程师在提出理论模型、模型验证和训练迭代等步骤中的人类智慧投入,只有顶级的智力资源和巨大的资金投入相结合才能在高科技应用领域摘得桂冠。
ChatGPT的出现是人工智能、AIGC应用的突破性技术成就,并且被认为可能带来搜索引擎领域的颠覆,过去点击式的搜索模式可能会变成对话聊天式的搜索,由此搜索行业在页面中植入广告营利的逻辑可能成为“过去式”。所以,各个搜索巨头纷纷行动,微软宣布了对OpenAI百亿美元的投资,并且迅速将ChatGPT接入旗下Azure、必应搜索等众多产品中。Google推出Bard来应对ChatGPT对搜索引擎这个Google主营业务的冲击。主流科技厂商的反应从侧面反映了这项技术突破的重大意义和未来巨大的发展潜力,但其实在科技巨头开始重视之前,ChatGPT已经在商业化方面彰显出强于以往AI应用的潜力,向公众开放2个月,用户增长已经突破1亿;同时ChatGPT的出现进一步打开了AIGC商业空间,产业链有望推动“价值重塑”。据全球知名财经、金融资讯和数据公司彭博的最新报告认为,到2032年,即9年后,AIGC市场营业收入将达到1.3万亿美元。
二、ChatGPT与AIGC国内发展现状
国内的数字化进程一直处于世界领先水平,从基础设施到上层应用都相当完备,这些基础是人工智能技术发展的必要条件。同时,从人才储备上来讲,由于重视人工智能技术的发展,国内人工智能领域无论是学术界还是工业界都培养了大量的人才。任何高技术的发展都离不开大量的资本投入,一方面,国家政策的大力扶植,为学术研究和产业发展提供了重要的资金支持,另一方面,随着国内的资本市场进一步发展,一级二级市场为初创或成熟企业提供了融资发展的机会,国内培养了众多人工智能领域的独角兽,如商汤科技、依图科技、云从科技。从企业角度来讲,百度是国内科技行业在此次新的革命中一马当先的巨头。百度深耕人工智能领域多年,2023年1月10日,百度宣布将升级百度搜索的“生成式搜索”能力,智能解答用户的搜索提问;2月7日,百度宣布将在3月完成其ChatGPT产品的内测,面向公众开放类ChatGPT产品———文心一言(ERNIEBot)。而腾讯也在2月3日公布一项人机对话专利,为实现机器与用户之间自然且顺畅的沟通而加紧市场脚步。由于人工智能产业投入巨大,需要庞大的用户数据基础,且短期内无法实现商业回报,如今在ChatGPT这样重量级的杀手级底层应用兼大语言模型发布后,国内AI厂商未来将迎来真正考验:不断投入的国内AI大模型的产品力是否能追赶上像OpenAI这样的开源巨头。
三、以ChatGPT为例的AIGC产业链探究
由于以ChatGPT为代表的带封装的自然语言处理大模型的成熟,其背后的AIGC产业后续将迎来应用上的爆发式增长。对于非专业的泛用场景来说,ChatGPT大模型在大量数据集下生成了极强悍的阅读理解能力、文章生成能力、代码生成能力和语义翻译能力。自然语言处理大模型的训练过程中包含了更多主题,不同于小模型只能在一般垂直行业的特定场景回应特定问题,取而代之的是,大模型能够抓取更多小众主题信息并给予有框架逻辑的回应,能力范围覆盖回答问题、撰写文章、文本摘要、语言翻译和生成计算机代码等任务。但大模型背后的工作量是巨大的,GPT模型从2018年GPT⁃1的1.17亿参数到2020年GPT⁃3的1750亿参数,数据集规模呈指数式增长,这也对前端的数据采集和标定提出了更高的要求。2023年4月发布的GPT-4,其参数规模更是达到了惊人的1.8万亿,较GPT-3的1千亿参数数量提升了百倍之多,庞大的参数数量为GPT-4在理解和生成文本任务上提供了巨大的计算能力,能够处理更复杂的问题,如长文本的上下文理解、语义分析以及知识推理等,如此庞大的模型规模,当然也带来了诸多新的挑战,如计算资源需求、训练成本等。纵观AI行业的产业链和价值链,对于模型的监督与训练来说,数据量级和跨度越大意味着标定和训练时间越长,以及监督过程需要引入更多的“惩罚”和“激励”机制,相应的数据采集、数据标定和训练等细分行业将迎来长期的业务链增长。对于后端的垂直行业的领域,大模型的基础设施成熟则能提供更便宜、更快的智慧解决方案。原本仅在几年前被认为不可替代的创造性工作正在被AI替代,当人们在这个行业中可以以更低的成本快速制造商品时,行业就已经完成了质的转变,普通的创意设计类就是可以预见的行业颠覆之一。例如,在ChatGPT之前,OpenAI在2022年推出的新模型DALL·E2,已经能从文本生成效果良好的图像,从成图来看已经可以和人类画师相媲美了。又例如,网约车平台和4G/5G的诞生,起初被认为是没有必要的发明,如今人们已经在很大程度上享受到效率提升的便捷。所以,嵌入了人类反馈强化学习以及人工监督微调,GPT模型具备了理解上下文、连贯性等诸多先进特征,解锁了海量2B和2C应用场景,比如文案写作和针对垂直行业更专业的知识库调用。未来应用层发展的一个可能逻辑是,在具有专业性质、知识封闭的垂直行业中,GPT模型在应用端将成为基础设施,为“二次开发”提供重要支撑,催生AIGC产业链。
当前,由于OpenAI目前对外开放的GPT-3版本所利用的数据集只截止到2021年,实际使用过程中仍然会出现专业性回答不严谨和存在道德盲区的特点,但对于这样一个聊天软件式的封装产品,ChatGPT本身已经展现出了非凡的潜力。在应答环节中,ChatGPT会主动记忆先前的对话内容信息(上下文理解),用来辅助假设性问题的回复,因而实现连续对话,这些都极大提升了交互模式下的用户体验。所以不难想象,在源源不断的数据训练滚雪球式的发展中,GPT模型将会吸取更多用户数据进一步优化用户体验,进一步催生AIGC产业链的爆发式崛起。
四、结束语
ChatGPT是一种生成式预训练模型,结合了人工反馈的强化学习技术,运用大量计算资源和海量数据,实现了对人类语言的理解和学习,存储了海量的知识。对语言的深入理解和广泛的知识存储,以及强大的内容生成能力,将会给搜索引擎等领域带来巨大的冲击,并且为AIGC特别是商业化的发展带来了新的机会。尽管ChatGPT有相对较高的技术壁垒,但依托国内人工智能领域完备的基础设施和充分的人才储备,我们认为在AIGC产业链方面将会迎来爆发式增长。
参考文献:
[1] 玛格丽特•博登. (2017). AI: 人工智能的本质与未来.(孙诗惠译). 北京: 中国人民大学出版社.
[2] 爱德华•阿什福德•李. (2022). 协同进化: 人类与机器融合的未来. (李杨译).北京: 中信出版集团.
[3] 刘胤衡. (2023). GhatGPT“横扫”校园缘何遭封杀. 中国青年报, 2023−02−17