• 简中
    • 繁中
  • 注册
  • 查看作者
  • AI续写小说悄然流行:人类特有嘅创作力,已经被AI复制?

    转载:本文来自微信公众号“全媒派”(ID:quanmeipai),作者:李秀,转载经授权发布。

    林黛玉葬花之时曹雪芹乱入,并同宝玉、袭人发生一场持续千年嘅世纪大战;鸿门宴再现,项羽喊住“伟大同光辉”同樊哙打作一团、而后项庄趁乱刺死刘邦;孔融让梨引发一场长达十多年嘅报复和最终精心谋划嘅血案;《桃花源记》中善良淳朴嘅村民竟会为咗保守桃花源嘅秘密而设计害死渔民……

    呢啲熟悉而又陌生嘅内容,并唔是网友们对经典文学作品嘅恶搞,而是来自于AI嘅故事续写。

    今年以来,由AI续写故事作为文本嘅视频喺B站悄然流行开来,一啲UP主利用市面上嘅AI创作应用续写人熟知嘅文学作品,再将新嘅作品以人声演绎,配上BGM后制成视频。

    经过AI嘅一顿操作,名著成‌爆款爽文,前有诸葛亮开战斗机,后有庄子研究“三体”,各种平行世界信手拈来,AI一本正经胡说八道嘅本事,比过去嘅地摊文学还强。

    AI续写小说悄然流行:人类特有嘅创作力,已经被AI复制?

    其实,对于相关工具嘅使用者而言,用AI进行创作并没有技术门槛:剩系要输入文学作品嘅某啲片段,AI创作机器就会根据畀定文字嘅内容同风格对故事进行续写,呢啲经过AI二次创作嘅故事,往往情节曲折离奇,同原作嘅走向大相径庭,呢种内容因为反常规和新鲜感而受到一啲网民嘅追捧。

    唔过话说回来,艺术创作呢种高度创意化、个性化嘅工作,原本被视为“人类嘅最后一片净土”,是理论上最唔可能被人工智能取代嘅工作之一,可而家人工智能技术嘅发展畀咗艺术创作开辟‌一条新嘅捷径。本期全媒派(ID: quanmeipai)带来一篇文章,探析AI创作正喺对内容创作领域产生系样嘅影响。

    AI写作是点样回事?

    AI创作也就是机器人写作,呢系一种拟人化嘅说法,实质上是指通过一定嘅计算机程序,对输入嘅信息进行自动化嘅分析、处理和加工,从而生成一篇较为完整嘅文章。总嘅嚟讲,今日流行嘅AI续写,其实已经算是比较成熟嘅能力。

    随住人工智能技术嘅快速发展,自然语言生成(natural language generation, NLG)技术喺世界范围内得到广泛嘅应用。《纽约时报》和美联社等新闻机构都曾采用NLG技术来撰写新闻报道;仅喺2014年,技术公司Automated Insights就实现‌以每秒超过2000篇嘅速度生成新闻报道,全年发布新闻共计10亿多篇。[1]

    AI写作背后嘅原理非常复杂,其核心是自然语言处理(natural language processing, NLP)技术,同时涉及到数据挖掘、机器学习、知识图谱等多项人工智能技术。自然语言处理是指让机器拥有理解并解释人类语言嘅能力,目标系等机器喺理解语言上像人类一样智能,最终弥补人类交流(自然语言)和计算机理解(机器语言)之间嘅差距。[2]

    自然语言处理(NLP)涉及两个流程,分别是自然语言理解(natural language understanding,NLU)和自然语言生成(NLG)。市面上嘅写稿机器人大都系NLG系统,目前主要有模板式、抽取式和生成式这三种技术方向。[3]

    模板式写稿机器人主要通过优化算法,喺预先存储嘅大量写作模板度,选择同畀定材料相匹配嘅模板,将信息加以组合生成文本,是目前应用最成熟、实现最容易嘅一种机器写作方法。

    抽取式机器人会对文本进行语义分析,识别冗余信息,抽取重要内容,通过摘录或概括嘅方法压缩文本,形成对于既定文字嘅摘要,再加以计算确保文摘嘅连续性,呢种技术广泛应用于新闻内容概括和文摘生成。

    生成式NLG主要通过深度学习和增强学习技术实现,机器通过大量嘅文学作品样本进行训练,学习各类写作风格、建立写作模型,再根据输入嘅文字片段获知任务需求,预测并生成同需求相匹配嘅文稿,进行输出。

    从现阶段来睇,模板式和抽取式写稿机器人嘅技术已经趋于成熟,喺市场上得到‌广泛嘅应用;生成式NLG技术更加智能,都系家阵时NLG技术中更为高级嘅目标,OpenAI等研究机构喺这方面做出‌尝试,并喺市场上得到‌应用。

    我哋身边嘅AI写稿工具人

    AI写作喺当今社会早已唔是乜嘢新鲜事,早喺2011年,《洛杉矶时报》就开始研发面向地震领域嘅自动化新闻生成机器人Quakebot。2013年3月,Quakebot因率先报道南加州发生嘅4.4级地震引发关注:2014年3月,美国洛杉矶发生4.4级地震,Quakebot用时3分钟就完成‌相关报道嘅写作和发布。

    同年7月,美联社引进Automated Insights公司开发嘅新闻写作机器人,开始使用自动生成新闻技术。此后,《纽约时报》《华盛顿邮报》《卫报》和路透社等媒体都走上‌自动化新闻发展嘅道路。[4]

    AI续写小说悄然流行:人类特有嘅创作力,已经被AI复制?

    Quakebot近期发布嘅新闻。图片来源:《洛杉矶时报》

    国内喺自动化新闻领域也有好多尝试:2016年5月,四川绵阳发生4.3级地震,中国地震台网研发嘅地震信息播报机器人用6秒写下560字嘅速报,报道内容翔实;2017年8月,该机器人喺第一时间报道‌四川阿坝州九寨沟县嘅7.0级地震,引发广泛嘅讨论和关注。这条新闻消息约540字,新闻涵盖‌速报参数、震中地形、热力人口、周边村镇、周边县区、历史地震、震中简介、震中天气8个方面嘅内容,并配有5张配图,用时仅25秒。喺此后嘅余震报道度,新闻机器人最快出稿速度仅有5秒。[5]

    AI续写小说悄然流行:人类特有嘅创作力,已经被AI复制?

    地震信息播报机器人对九寨沟地震嘅报道 

    除咗新闻报道以外,AI写作也喺第啲文字创作场景得到‌广泛嘅应用。目前,无需人工干预嘅机器人写作可以生成诗歌、广告、各类行业分析报告、歌词、小说、甚至剧本。

    以诗歌为例,微软研发嘅机器人小冰于2017年出版‌诗集《阳光失‌玻璃窗》,呢是历史上第一部人工智能诗集,其中包含139首现代诗。[6]

    诸如“快将光明嘅灯擎起来‌/那里有美丽嘅天/问住村里嘅水流嘅声音/我嘅爱人喺边/因为我嘅红灯是咁样嘅幻变/像是美丽嘅秘密/佢系一个小孩子嘅歌唱/那时间嘅距离”嘅华丽辞藻还颇具美感,只系喺逻辑性上有所欠缺。除咗现代诗,律诗、藏头诗、词等各种风格嘅诗歌创作软件已然喺市场上层出唔穷。

    相比于新闻,故事、小说等连续语义嘅创作会更加困难,而呢啲也早已唔是难题。早喺2016年嘅伦敦科幻电影节上,纽约大学研究人员开发嘅机器人Benjamin创作‌一部长达9分钟嘅科幻电影Sunspring,赢得‌大批关注;MIT媒体实验室开发嘅机器人Shelly专职撰写恐怖故事,并喺Twitter更新;Botnik研究室采用预测嘅算法创作‌《哈利波特》嘅续集。

    除咗写稿,AI创作仲有第啲形式

    当AI创作技术应用于写稿,可以诞生机器版嘅记者、小说家、诗人、编剧等,而当佢应用于绘画、音乐和舞蹈领域时,则可以“培养”出画家、作曲家和编舞人员。

    AI绘画创作大放异彩

    利用机器绘画早已写入‌人类嘅梦想清单:早喺18世纪70年代,瑞士已经有人利用机械臂绘画;2016年,谷歌研发嘅绘画AI喺旧金山拍卖会上大放异彩,其作品一度拍出单幅8000美元嘅高价;2019年,微软小冰独立完成嘅原创绘画作品喺中央美术学院美术馆展出,并于2020年推出个人绘画作品集。[7]

    AI音乐创作谱写别样乐章

    AI喺音乐创作中嘅应用比比皆是:2016年,索尼公司计算机科学实验室CSL嘅DeepBach项目仿照巴赫嘅风格创作嘅合唱曲目,被专业音乐家误认为是巴赫嘅作品。

    除咗谱曲,AI 还可以创作可以唱出声音嘅歌曲,CSL实验室嘅机器人Flow Machine模仿披头士嘅风格,自主创作‌歌曲Daddy’s car。法国计算机科学家Pierre Barreau创造嘅作曲AI应用Aiva可以根据需求创作唔同风格嘅音乐,甚至可以根据图画作曲,Aiva也于2017年成为“法国及卢森堡作曲家协会”(SACEM)嘅首个非人类会员。

    AI舞蹈创作演绎非凡舞曲

    有唔少团队开发‌舞蹈创作类嘅AI:谷歌研究院建立‌名为AIST++嘅3D舞蹈动作数据集,据此训练嘅AI能够根据畀定嘅音乐和一段2秒左右嘅种子动作生成长序列嘅逼真嘅3D动作。目前已有嘅舞蹈创作AI基本都可以根据目标音乐生成同之匹配嘅舞蹈动作,并通过3D建模嘅方式将舞蹈进行表演。经过模型构建方法嘅迭代升级,AI生成嘅3D舞蹈喺动作质量、动作多样性和动作同音乐嘅相关性方面都有住还唔错嘅表现。

    AI续写小说悄然流行:人类特有嘅创作力,已经被AI复制?

    AIST++舞蹈数据集嘅示例。图片来源:https://arxiv.org/pdf/2101.08779.pdf

    OpenAI公司最新推出嘅GPT-3模型,则开放‌API服务,申请者可以调用GPT-3嘅API,将其进一步开发为论文翻译工具,网页生成工具,前端设计器,聊天机器人甚至游戏开发工具。喺GPT-3嘅身上,我哋睇到AI从某一个领域嘅创作者成为各方面兼修全才嘅可能性。[8]

    AI作为内容生产者仲有边啲缺陷?

    AI创作固然强大,但要想做到大规模嘅普及和落地,尚有一啲问题横亘于我哋面前。

    首先就是AI嘅价值判断问题。机器学习只是提取训练集数据嘅风格特征,并对呢种加以模仿,机器睇似具有“学习”功能,实质上仍落入‌按图索骥嘅窠臼。

    AI本身对文本创作并没有价值判断,所以喺AI生成嘅故事当度,我哋可以读到讽齐王纳谏嘅邹忌为咗保住权势富贵而出卖小妾,读到为孩子买橘子嘅父亲喺月台摔倒暴毙……呢啲离奇嘅情节唔仅同逻辑唔符,对正常嘅价值导向也难以判定。如果训练内容存喺问题,或者某啲用户输入时刻意引导,AI生成嘅内容喺伦理道德方面嘅处境更会雪上加霜。

    其次是AI创作嘅版权问题。喺家阵时技术框架下,AI嘅训练效果喺好大程度上取决于语料库,没有足够量嘅语料库,AI便无办法进行学习,更无办法进行创作。

    那么AI产出嘅作品该归语料嘅作者还是归AI嘅创作者所有呢?如果归语料作者所有,噉样又点样为庞大嘅网络语料资源划定作者呢?如果归创作者所有,又能否将使用‌相同技术线路和算法嘅创作者视为抄袭?呢啲问题仍然需要法理和伦理上嘅探讨。

    最后便是AI使用者嘅问题。

    AI为内容创作提供‌一种更加轻松、便利嘅可能性,但喺一啲别有用心嘅人眼度,AI成为咗助长抄袭嘅洗稿工具:输入一段语句,AI就会对语言结构进行重组,对关键词加以替换,从而喺短时间内复制网络爆文……技术虽为中立,但唔良嘅使用意图让技术成为咗帮凶。

    自AI诞生之日起,有关于AI取代人工嘅忧虑便唔绝于耳。显然,由AI续写嘅故事虽然有啲扯,但终究还是能满足一部分人嘅内容消费需求,甚至有走红嘅潜质。至于智能机器同内容创作者嘅关系,终归还是会走向人机协作、共生共进,而唔是相互取代、零和博弈。

    参考链接: 

    [1] 链接

    [2][3] https://www.sohu.com/a/194437537_644338

    [4][5] 链接

    [6] 链接

    [7] 链接

    [8] 链接

    cantonese.live 足跡 粵字翻譯

  • 0
  • 0
  • 0
  • 180
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: