■刘兴亮(DCCI互联网研究院院长、知名互联网学者)
目前市场已经存在的生成式预训练语言模型和产品包括GPT-4、基于GPT-3.5的ChatGPT、文心一言和New Bing,这4种模型有一些本质的区别。首先就是多模态的问题,GPT-4和GPT-3.5之间的第一个区别就是多模态问题,GPT-3.5模型只能处理文字,而GPT-4可以处理图片。第二,GPT-4在处理结果上也更加准确。第三个区别是GPT-4能够处理更复杂的指令,读取和生成的文字篇幅可以达到2.5万字。New Bing和GPT模型也不太一样,它首先是一个搜索场景,因此会回答得丰富得多,是2种不同的场景和产品形态。文心一言和以上3种模型在文字处理上大同小异,除了拥有可以输出图片、视频的能力,文心一言对于中文的理解更强,这是它的亮点。
人工智能:是颠覆还是赋能?自从语言模型在国内引起舆论风暴后,很多人都在问,“是不是我要失业了?”“这种人工智能对我自己的行业有什么影响?”OpenAI和宾夕法尼亚大学的相关研究人员在预印本网站arXiv上,发布了一篇有关语言大模型对劳动力市场潜在影响的论文,论文结论指出,对于约80%的美国人来说,至少10%的工作任务会受到大模型的影响;此外有约19%的人的工作任务受影响的比例超过50%,受影响的职业包括记者。因此毫不夸张地说,人工智能对传媒行业的影响将会是巨大的,甚至传媒行业可能成为第一批次被冲击和影响的行业。假设办一个互联网大会,3天的会议素材如果用人工处理,即使是高效率的人,起码也需要2~3天,但如果由AI来完成,只需要20分钟,包括添加字幕、自动分发等等,只要你可以传达正确的指令,AI甚至还可以根据不同平台内容进行不同尺寸、不同内容框架的制作。
这当然是非常消极的一种说法,乐观地看,AI让所有以脑力劳动为主的行业中的个人都拥有了一个智能助理。几乎所有人都在问,哪个行业会被代替?360行难以穷尽,但是总结规律来看,具备了以下两个能力的人很难被AI代替:第一就是提问的能力,提出一个有价值的问题是很需要积累和深度思考的;第二就是纠偏答案的能力,可以类比搜索引擎的“搜商”,一个人能多大程度地利用AI得到自己想要的答案,这在未来是一种基础能力。工作不是被AI淘汰的,而是被那些掌握AI工具的人淘汰的。掌握AI工具,在生活和工作中就会如虎添翼。
对传播格局来说也是如此,AI可以把传播权力赋能到个人,也可以帮助个人筛选信息,在人工智能的筛选下,人们只需要看到最先发布或最权威的消息。未来的传播链条中,人们会更关注于自己需要的内容,因此新闻媒体属性、传播范围等都会发生大的变革。因此,未来在垂直内容领域,对于头部媒体来说是一种话语权的上升,其传播内容也会更加细分化。
搜索引擎大变局?人工智能除了信息处理能力外,更让人关注的是百度、谷歌、微软在搜索引擎方面的竞争。将大模型套嵌进入搜索引擎之后,搜索引擎格局会发生怎样的改变?Gmail创始人保罗·布赫海特(Paul Buchheit)反复强调GPT模型会颠覆搜索引擎、摧毁谷歌,就像当初搜索引擎摧毁网络黄页一样。我的观点没有那么激进,我认为目前的生成式对话机器人只做到了可用,还做不到可信。目前的大模型训练内容中,还存在很多错误内容。搜索引擎的逻辑是,当用户输入关键词或输入问题的时候,搜索引擎会给出很多答案供其选择和辨别。但是对话模型的原理在于,除了极个别特殊问题它会回答“不知道”以外,99%的场景下,即使不确定的问题,它都会给你一个答案,就会出现所谓“一本正经地胡说八道”,这是因为产品的原理不一样。
所以短期来看,GPT类产品还取代不了搜索引擎,并且搜索引擎和GPT类产品是相辅相成的。就像New Bing一样,让用户自己选择,是想和它聊天还是沿用传统搜索模式,把选择权交给用户,不要替用户去做选择。未来往远了不好说,至少短期两三年内二者是互补的关系。
应用赛道才是真机会。文心一言正式发布后受到了不少“冷嘲热讽”,但它确实有自己的优势,那就是更懂中国。我们可以理解为,未来通用的串联GPT类产品更多地是一种路径,需要更垂直深入进各行各业,在专业知识方面,AI比人类会做得更快更全面。生成式大模型目前的赛道虽然是科技巨头的赛道,但初创公司依然有自己的机会,即在于如何能将自己的业务内容和GPT类产品更好地结合,让大模型的内容和结果赋能自己的产业内容。3月16日微软发布由GPT-4模型驱动的Copilot人工智能服务,适用于Word、PowerPoint、Excel、Outlook等Microsoft 365商业软件,主要运用于工作场景,帮助用户生成文档、电子邮件以及幻灯片等。这是一个很好的例子,未来我们会看到医疗、电商、物流、传媒等领域与大模型结合的创新,这是未来“众生”的机会。