■中国出版传媒商报记者 张馨宇
编者按 日前,清华大学新闻与传播学院教授沈阳利用AI生成的(首部)科幻小说与人类作品竞赛并获奖,其团队还搭建并跑通了专门赋能于数字出版的AIGC平台,将一本书变成多模态内容的呈现形式,连接文字和影音两个世界,为“出版”带来新的可能与想象。AI辅助创作工具也层出不穷,AI生成的图书大量涌入亚马逊Kindle,甚至其中许多进入了畅销榜。或许,人工智能真正颠覆传统图书出版行业的未来已经不远了。
假如让你用“元宇宙”“人形机器人”“AI”写作一篇科幻小说,你会写出怎样的故事?
“为什么人类会感到孤独、恐惧、愤怒或欢乐?这些情感都是因为你们在某种程度上感受到了空虚。孤独是因为你们害怕与他人的距离,恐惧是因为你们害怕未知,愤怒是因为你们害怕失去控制,欢乐是因为你们在某一刹那感受到了与宇宙的连接,填补了那一刹的空虚。”
这一段取自《机忆之地》,是“@硅禅”写下的寓言。《机忆之地》由清华大学新闻与传播学院教授沈阳及其团队利用AI生成的(首部)科幻小说,并在第五届江苏省青年科普科幻作品大赛中获得二等奖。AIGC文学作品与人类写作作品一起参赛并获奖,这或在文学史上是第一次,也是AI史上的第一次。这篇小说从大纲到标题,从正文到配图,甚至连“硅禅”这一笔名均由AI创作生成。
什么是AI写作?
提起AI写作,沈阳认为,从AI产生内容的质与量的角度看,当前市面上存在着三种模式的AI辅助写作。第一种为润色,以人为主体,即使用者事先拥有一份材料,而后利用AI进行修改、提升的模式,这种模式是先有了人类思想的结晶,再由AI进行补充提高。第二种为合作,也就是人类和AI各占一半主体,即在创作过程中引入AI,并在这一过程中把AI的能力发挥到极致。第三种则是以AI为主体,全程由AI进行创作,AI不够完善的地方由人类来进行润色或提示修改。
《机忆之地》的创作就是第三种AI写作模式。沈阳用3个小时与AI平台进行了66次对话,在AI生成的约43061个字符中复制出5915个字符,最终完成了这一作品。沈阳表示,在这一过程中,团队没有对小说主干内容进行任何干预。“《机忆之地》最大的特色就是它的大纲是AI自动生成的,我们只给AI圈定了一个领域,其他全是AI自己完成的。”(下转第14版) (上接第1版)
在这一过程中,创作主体已然明确,这是在人类提供内容限制下,AI自主创作的科幻小说。沈阳认为,这样的作品可以视为AI的原创作品。AI正在疯狂地迭代,就像人类也在进步一样,作品自然可以放在同一起跑线上对比,只不过这个对比的时间效应很短,AI是真正的“士别三日当刮目相看”。
沈阳表示,在这66次对话生成的4万多字中,并不是总共生成了4万多字的小说并在其中截取5000多字,而是把其中一段反复地和AI对话、调整,最终把完善好的一段拿出来拼回小说完整的章节中。也就是说,《机忆之地》的最终版是各个段落定稿的组合。这一创作过程充满冗余,这是AI目前创作的不足之处。由于目前AI在上下文长度与连贯性上仍存在很大缺陷,对话的66次中,大量的提示语和修改都是在做文章连贯的工作。从目前来看,AI写作改变文学创作生态还是遥远的未来。不过近日,OpenAI 在其首届开发者大会上推出了GPT-4的加强版GPT-4 Turbo,将GPT-4的32k上下文加长到了128k,容量相当于一部中篇小说。当AI的上下文窗口长度大幅度扩展后,人与AI共同创作内容时的交互次数就会大幅度降低。沈阳表示:“《机忆之地》如果改用长窗口上下文AI,完成创作的对话次数可以压缩在30次以下。”
除此之外,AI在对话过程中还存在少量误会,比如在第35次生成中,提示语为“用卡夫卡的文学风格,重新改写这一段内容”,内容结果会出现“就像卡夫卡笔下的角色”这样的误会。沈阳认为:“这是很个别的情况,大部分情况下只要把任务对AI描述清楚,AI都可以按照要求完成任务。”
AI版权归属的迷思
既然是AI创作的作品,那是否可以被认定是AI的版权?作为AI的坚定支持者,沈阳在版权归属方面却有很多踌躇与思考。“我此前提倡‘最小版权识别单元’的概念,假如你创造出了人类历史上从来没出现过的包含8个字的句子,即可把这8个字的版权归属于个人,因为AI并不会把内容百分之百地复述出来,每次都会重新组合,因此,使用AIGC可以通过智能合约付费。不过这是我最早的想法。”
在创作《机忆之地》后,沈阳对于AI版权归属的思考产生新的看法。这一文章是AI学习卡夫卡的风格进行创作的,那么风格是否需要保护、如何保护,版权归属问题就更加抽象了。“从目前来看,光讲保护没有手段也不行,不过文字还是可以按照最小版权识别单元保护的。”
在AI生成领域,除了AI辅助写作还有AI绘画,这一领域同样是沈阳极为关注的。“我是AI绘画的重度使用者,尤其是在版权问题上,刚开始我是不主张对绘画进行保护的,因为技术上没有可能性。但在我创作3000幅AI绘画后,我现在很想把其中比较满意的一二十幅保护起来。”
如何保护?在AI创作中,“随机种子”是一个重要的概念。它是一个起始点,用于生成随机数序列,通过改变随机种子获得不同的艺术效果,它决定了生成的艺术作品的风格和特征,使得每次生成的作品都是独一无二的。用同样的提示语也会得到不同的种子数,即使把生成的提示语公开出来,也不会有一模一样的图片生成。
沈阳认为,如此创作出来的AI绘画作品版权应该归属于创作者(提示语创作者)。一是在生成图画后很难有一模一样的作品再次被AI生成。二是在创作者生成图画后,网站上有关于这一作品的唯一链接来证明是某人在某一时间点与AI共同生成。但更复杂的情况是,创作者需要输入几百字的提示语才能生成一幅图片,那这几百字是否可以被保护起来?“对比之下,我很想把《机忆之地》的版权归为我有。”
AI不会创新?错了!
随机种子的概念很容易让人理解成AI只是将学习到的知识拼凑生成内容。年初,《科学》《自然》《肿瘤学》等多家科学期刊发表声明,不接受论文将ChatGPT列为“合著者”。其中《科学》发文称,“原创”这个词足以表明ChatGPT生成的文本不可接受。生成式文本不能在论文中使用,AI不能成为作者,违反这些政策将构成学术不端行为,与篡改图像或剽窃没有区别。那么AI在使用范围上是否应该有限制?AI创作的内容到底是不是剽窃?
沈阳认为,当AI学习了3000亿条知识后,就意味着它可以随意组合这3000亿条内容。“很多人说AI不会创新,其实错了,AI至少现在会组合式创新,而我们人类大部分创新都是组合式创新。因此,我们应该允许AI在不违背人类公序良俗下进行创作,甚至在这个条件下无限制地创作。”据他描述,在做研究方面,通过与AI合作,其工作效率大约提升了9倍。
沈阳认为,在可靠性上,AI本身在细节内容上确实会出现一定概率的AI幻觉,比如它会说“王阳明出生在江西”“南非总统曼德拉是总理”等等。所以在常规使用中,需要做双AI对比解决AI幻觉的问题。“在一个问题上两个AI系统同时出错的概率是非常低的,这是去除AI幻觉的有效方法。”
文学创作只是第一步
沈阳畅想:“下一步,我们希望每个人都能用上AI工具,很多事情就不需要人去做了。”
数字出版正是沈阳团队关注的目标之一。目前沈阳团队已经搭建并跑通了专门赋能于数字出版的AIGC平台,基于“先问”AI内容创作一体化平台。清博智能研究院院长李祖希介绍说,这一平台的理念是“一本书的奇幻之旅”,它有三方面能力。一是把文字图书自动变成绘本。二是将一本书的内容制作成在流媒体平台上可传播的视频。三是AI可以将书中的人物变成可交流的虚拟人,读者边看书边和主人公交流,主人公同样维持着书中的设定。
李祖希认为,这一模型一方面可以把书变成多模态内容,辅助书中文字,另一方面也可以作为引流或是营销手段帮助读者对图书产生更大的兴趣。“这一模型非常适合少儿读物和科幻读物。”
目前,多家头部出版机构已经和清博智能达成合作,将一批科幻作品赋予多模态的内容体验,在大大提升受众面和接受度的同时,也利于节省时间、物力与人力,帮助读者连接文字和影音两个世界。
所以,AI一边写书一边以内容化作影像的未来,距离我们还有多远?

