观点

更多

谈机器人新闻写作

关键词: 机器人

发表于2016-12-17 03:08:55 0 0

2015年9月10日,腾讯财经发布了一篇由自动化新闻写作机器人撰写的报道,标题为“8月CPI涨2%创12个月新高”。这篇报道不仅介绍了CPI的相关数据,还援引了相关专家和业内人士对数据的分析和预测,从字顺、数据翔实,仅用一分钟完成。利用新闻机器人写作新闻报道的事情国外早已实现了。现在的雅虎和美联社相当一部分财经报道和体育新闻都是机器人写的。它们使用的都是一家叫做Automated Insights(AI)的公司开发的软件WordSmith。只要导入最新的数据,1分钟最快可以生成2000篇报道。


一、概念


机器人新闻写作(Robot Journalism或Automated Writing),其实是一个拟人化的说法,确切地说,是指运用算法对输入或搜集的数据自动进行加工处理,从而自动生成完整新闻报道的一整套计算机程序。与以往人工智能在传媒业的应用不同,机器人新闻写手最大的特征就是新闻生产的完全自动化。除前期的技术开发外,在具体新闻写作过程中,人工的参与并不是新闻产品产出的关键和决定性环节,新闻生产的主体实现了由人向机器的转变。新闻机器人的现状新闻机器人与大数据时代数据挖掘的兴起密不可分,经由计算机自动生成的新闻主要集中在高数据密度、高信息透明度、低语境的财经、体育、民意调查和天气等新闻报道中。


二、机器人自动写作的工作机理


下面以前述Automated Insights公司开发并已经被诸多品牌公司,包括像美联社这样的通讯社采用的自动写作平台Wordsmith为例,简单介绍一下其工作原理与过程。Wordsmith平台的任何一篇“自动生成”的作品的写作流程分以下几个步骤:


1.获取数据。首先需要消化关于所服务的客户,即报道对象的各种形式的数据和资料,包括以APIs、XML、CSVs以及各种字处理图表等形式的数据,以及第三方(如Google Analytics)提供的相关客户的各种数据(运营、业绩、报道、评价、引述等)。作为一个以数据处理为基础工作的写作平台,Wordsmith可以处理“几乎任何形式或格式的数据”。


2.分析数据。这里涉及到对各种数据的解析以及内在关联的勾勒,并把它们放在历时性的演变背景中来进行解读。


3.提炼观点(identify insights)。通过对目标客户各种数据中所呈现的模式和趋势的揭示,并把它们纳入到更大的行业或社会、国家的背景中来解读其意义,从而通过这样的参考和比对,得出一些具有可操作性的意见和建议。


4.结构和格式(structure&format)。Wordsmith平台需要用其自然语言生成功能对此前的分析和提炼得到的观点进行故事化叙述,并按照需要生成各种形式的文本:长文、短新闻、可视化图表为主的内容、推文、标题导语等等。


5.出版。Wordsmith平台能够将所生成的文章,通过多种方式,实时发布到客户指定的平台上。


三、机器人自动写作的优点


首先,新闻机器人最大的特点是精准而高产,这显然是得益于软件的不断改进,从而形成了一套精准完整的个性化定制服务,甚至可以精确到微观的个体读者,而这一点是普通新闻记者无法做到的。


其次,新闻机器人能够在一定程度上提升报道的真实性、客观性和中立性。新闻客观性一直是饱受争议的话题。部分学者甚至主张,因为人类无法避免错误和偏见,新闻的客观性是几乎不可实现的目标。


最后,新闻机器人的采用大大简化了生产流程,解放了新闻从业者的劳动生产力。传统新闻生产的“采、写、编、排”等环节被整合成为“信息抓取”和“文本生成”这两个环节,使新闻媒体的劳动生产率得以大幅提升。


四、机器自动写作的局限


首先是报道主题的局限性。由于新闻机器人是计算机算法逻辑的一种外化与衍生,且以精确的数据挖掘和既定的写作模板作为其高产量的技术支撑。因此,在当前的新闻生产实践中,新闻机器人主要报道的主题限于财经、体育等少数几个领域内,还未全面进入深度调查报道、解释性新闻等“硬核”领域。新闻机器人在抓取信息数据和生成新闻文本的过程中,能够提供海量信息,却无法直接生成更有深度的解释性新闻或评论。


其次,新闻机器人的广泛运用,会对个人隐私和数据安全带来威胁。在大数据和物联网时代,万事万物都能够被“数据化”,并通过海量云端程序进行数据化联络与沟通。新闻机器人作为一套精心设计的电脑程序软件,在数据抓取过程中,存在着侵犯隐私,滥用数据的隐患。


再次,新闻机器人的广泛运用将加剧全球新闻传播的“失衡螺旋”。绝大多数发展中国家还不具备在这个领域内的自主研发能力,再加上他们在虚拟空间的“网络主权”和在云空间的“数据主权”未能得到有效的保护,因此,新闻机器人在世界范围内的广泛应用非但不能消弭全球新闻传播领域内“双头”(美英)垄断、西强东弱的不平等状况,反而会加剧发展中国家对发达国家在数据抓取、新闻生产、信息流动和议题设置上的“被迫依赖”,从而陷入“强者更强、弱者更弱”的失衡螺旋。


五、机器人自动写作的趋势


首先,新闻机器人的生产模式将从基于互联网数据抓取的断点式自动生成模式,逐渐转换到基于物联网持续性数据抓取的自动生成模式。机器人由目前的“写作机器人”发展出“编辑机器人”和“评论机器人”等新的品类并非痴人说梦,集写作、编辑、分析(评论)“三体合一”的真正意义上的新闻机器人终将成为新闻业的中坚力量。


其次,新闻机器人将在一定程度上取代一般记者所从事的程式化的事务性工作,并使记者真正成为像律师、医生那样兼具深厚人文修养和技术素养的高端职业。随着新闻生产的分工将日趋细化和明确,新闻机器人将充分其在数据挖掘和分析上的作用,而记者可以专注于调查性新闻、解释性新闻等高品质新闻的生产。


最后,发展中国家将日益重视新闻机器人的产业升级,并出台相应的政策、加大投入,推动相关技术的自主研发。从全球传播的角度来看,新闻机器人的技术革新与网络空间的全球治理紧密相连。如何保护各国的“网络主权”和“数据主权”,为新闻机器人制定一套体现各方利益和诉求的专业伦理规范,亦将成为重构全球新闻传播新秩序的前沿课题之一。


机器人自动写作


六、机器人自动写作对新闻业的影响


首先,在一些综合性通讯社或媒体中,一线内容生产的总体格局可能会发生重大变化。在前述财经、气象/地质、体育、健康等领域的常规稿件的生产中,传统的记者写稿环节,可能会解构为记者“指导”下的机器写稿和记者/编辑进行人工修改把关两个环节。记者或编辑将主要通过基于算法的内容管理系统(即CMS)进行审核把关和稿件推荐。


其次,稿件生产会越来越依赖于媒体自己建设的数据库以及实时的基于大数据的数据挖掘工作,这意味着在常规新闻写作中,传统的记者现场采访的重要性和必要性可能会有所降低,而中介化在场感的获得和营造将成为关键。


第三,稿件内容的发布和推送将会更加个性化、定制化,不同新闻终端消费者收到的内容可能会有不同的版本。基于对内容消费者消费偏好和方式的分析,在新闻发布和推送时作相应的个性化裁剪,是完全可以做到的。


最后,新闻传播从业者核心素养要求的变化。自动新闻生产的不断改进和复杂化,将不断挤压新闻业中那些劳动密集型的工作或新闻生产环节,让这些工作或生产环节,就工作量和所花费的时间而言,主要通过机器即可完成,人工的干预和关键决策,本质上仍会起到主导作用,但从工作量上而言,不再需要在创造性要求高度不均的各个环节都同等付出,而只需在一些关键环节上介入即可。记者和编辑,由此需要重新定位自己工作的核心价值到底在哪里,时时考虑自己所从事的工作,是否具有一定智能的软件或机器人也能胜任。



2016年最后一场行业盛会,第二届创新奖评选再度来袭,12月23日,北京亮马桥四季酒店,见证新资本、新产业、新技术、新理念带来全新变革。科技赋能产业,见证下一个商业风口!


2016亿欧创新者年会.jpg

来源:亿欧

0条评论发表评论

热门文章

京ICP备11027698号 CopyRight 2010-2015 All Rights Reserved 

公司旗下网站:www.sendto.cn(公司网站)www.jiuye.net(就业数字图书馆)

合作单位:北京交通大学出版社