传媒教育网

标题: 腾讯机器人写作的幕后机关,要做用户私人资讯管家 [打印本页]

作者: 杨静芝    时间: 2016-1-8 20:30
标题: 腾讯机器人写作的幕后机关,要做用户私人资讯管家
2016-01-08 全媒派
2015年是不是被机器人写作虐惨了?机器人真的要攻占记者领地了吗?全媒派沙龙“万万没想到技术宅还可以如此改变传媒业”独家揭秘腾讯财经机器人写作的幕后机关。

还记得红极一时的腾讯机器人Dreamwriter吗?去年9月10日腾讯新闻上线第一篇机器写作稿件《 8月CPI同比上涨2.0% 创12个月新高》,瞬间引发业界高度关注。截至2015年10月15日,已有《中国新闻社》、《京华时报》、《中国日报》等100多家媒体和网站对腾讯旗下的自动化新闻写作机器人Dreamwriter进行了报道。机器写作的春天是不是真的要到来了?机器人能实现哪些传统新闻人写作的不可能?且听腾讯财经主编刘康一一道来。

缩水版干货奉上!

1Dreamwriter是如何工作的?

腾讯根据财经报道和体育报道的不同特点开发了双系统平台。在表达清楚新闻内容的同时,开始尝试个性化push。针对用户的不同喜好,推出精简版、民生版等不同风格的稿件来满足用户的不同需求。

基于数据、算法和逻辑,Dreamwriter通过对财经官网公告好体育实时赛况的信息抓取,来掌握资料。资料进入数据库后通过算法的匹配来实现成稿,这其中包括复杂的逻辑判断过程和人工智能的自主学习,形成样稿之后由CMS发布,最后呈现在你的面前。

2国际媒体如何玩转机器人写作?

《纽约时报》Blossom、《华盛顿邮报》Truth Teller、《洛杉矶时报》智能内嵌模版、《卫报》#Open001、路透社的Open Calais、美联社的Wordsmith六家国际顶级媒体已经有了各自的机器人服务系统,越来越多的机构和媒体人意识到机器人系统在媒体行业未来有多么不可估量的地位。

这之后《纽约时报》Blossom、《华盛顿邮报》Truth Teller、《洛杉矶时报》智能内嵌模版、《卫报》#Open001、路透社的Open Calais、美联社的Wordsmith六家国际顶级媒体已经有了各自的机器人服务系统,越来越多的机构和媒体人意识到机器人系统在媒体行业未来有多么不可估量的地位。


3机器人写作的优势在哪里?

机器人写作相对于人工写作有着先天的成本优势。它依靠前言技术做支撑,拥有更快的速度和更高的效率,大幅降低了人工和采购成本,而且也有潜力成为海量流量的入口。不仅如此,由于其应用领域的特殊,也有潜力提供精准定向的广告和数据服务,从而带来更多的商业收入。

4.全球媒体下一代内容与服务平台



机器人写作的未来在何方呢?最终也会走向订制。成为用户的私人资讯管家和投资顾问专家。对媒体而言,它将提供数据和资讯产品服务,成为下一代媒体必备的工具智能写作助手。对于金融行业而言,实时快讯、智能客服、投资组合等服务都有可能被机器人写作承包。


以下为内容实录(有删减):


我们受到大家关注是因为9月份的一篇做数据的稿子(腾讯网,《 8月CPI同比上涨2.0% 创12个月新高》),业内都很关注这件事。

1财经和体育双系统机器人



我们现在拥有财经和体育的双系统平台。为什么开发双系统?因为腾讯财经有自己的表达方式和计算模型,而体育偏向于深度表达和赛事报道。两个体系不一样,因此我们针对两个平台开发了不同的系统。


现在我大概介绍一下我们现在做的产品。第一篇面世的稿子是按照最常见的财经稿件的写法来布局的。第一个版本出来以后很多业内的老板们,都向我们提意见,觉得还是中规中矩,不够有特色。因此我们在做第二个版本的时候,进行了小迭代,开始尝试个性化push。比如我们会针对不同喜好的用户,在同一时间发布三篇不同版本的稿件。有人说稿子太长了,想在几秒钟或者半分钟知道个大概,我们有精要版稿件;有人比较喜欢通俗易懂,结合生活体验的内容,我们就推出了民生版稿件。


我们尝试不同版本的目的在于开发一套让每个人收到的不同版本稿件的系统。我们对基本算法做一个归纳,推测你喜欢什么样风格的文章,再给您推送这样的文章。这才是机器写作的精髓所在。但是,文章是通过人的思维来感动身边的人的。机器没法取代这部分。机器可以同时写成千上万篇文章,但可能只有一篇是你喜欢的。


接下来是对我们体育版本的介绍。体育新闻机器写作的难度体现在以下两个方面。其一,各类赛事的评分机制不同。比如足球、篮球,按进球数积分,而跳水等需要评委来打分。用不同的模板来匹配不同的项目,这是比较复杂的。其二,就是我们经常所说的拟人化。机器需要写得像资深写手一样,有人情味,有吸引人的地方。

2.腾讯为何要开发Dreamwriter?



为什么我们要做机器人写作?我们并不是全球第一家做机器人写作的,国外已经有很多先例了,比如Narrative Science公司和AI公司。为什么我们不用他们的产品呢?我们做过研究,发现中文的表达环境和语法环境确实和英文不大一样。考虑到他们是英文提供商,我们还需要花时间翻译,价值就会大打折扣,我们就想自己开发一套中文系统。


关于全球机器人写作的最新进展。大家可以回顾一下全媒派一篇专门讲机器人写作的文章,总结得比我还要全面。那么机器写作可以带给我们什么好处呢?首先是技术上的尝试。我们每一次的技术迭代都会给内容生产带来冲击。我们身处在这个行业里面,必须让自己一步步往前走,否则就会被时代淘汰。第二是效率,我们希望更少的人产出更多的量。第三是节约,今后门槛比较低的工种或者岗位我们就会陆续减掉,这也是大势所趋。最后就是流量,现在所有的资讯都在抢时间,如果我们的机器写作比别人快十几秒,哪怕快1秒,我们也有一定的领先优势。


3未来着眼媒体和金融开发方向



对于将来,我们希望能成为下一代的内容生产和服务平台,简单来说就是定制化的私人资讯管家。关于这一点AI公司的老总想得更远,他甚至觉得未来的天气、体育运动等个性化的资讯都可以在可穿戴设备里呈现。这样的话未来我们就不需要屏幕这样的东西。刚才我看VR硬件技术,还有谷歌眼镜这种穿戴设备,也可能在这方面有所体现。现在我们的稿件都是通过视觉看文字,将来能不能跟云对接一下?比如未来车联网在车载服务上也能介入,这样就不需要有屏幕,可以迅速读出来,根据各自的不同需要来定制各自的资讯。这是我们后期想尝试的东西。


这是我们暂定的开发方向有媒体和金融两个方面。媒体方面有媒体的数据和资讯服务,凡是有数据的地方,这套系统都是非常匹配的。我们还希望成为下一代媒体的必备工具,不是取代任何编辑,而是我们未来媒体人士的必备助手,是帮你整理资讯、整理数据的机器人朋友,是帮助你而不是阻碍你。在金融方面,我们可以从事行情资讯,上市公司的公告,宏观数据和与数据相关的报道或者资讯服务。






观众提问



问:对我们来说,智能写作的关键是大量干净的模式化的数据源。我们(美联社)曾经想过在中国寻找这类数据源,但是发现中国体育行业的数据源特别难找。我非常想知道你们是从哪里找到大量干净的数据源的?


刘康:腾讯采购了NBA的全套数据。正如您所说,我们也想找干净又精准的数据,本来想选足球、网球,但后来发现NBA的数据最详实。甚至每一个比赛小节的数据都会及时传送过来。我们就根据这样的数据出快讯和小节报告。


问:美联社在财经写作方面做得比较早。你提到的智能写作生成财经报道,做个性化特别难,但是它有另外一个突破口,就是在信息及时准确并且海量的时候,针对这些信息报道做模型,做一些更精准深入的产品挖掘和分析。你在这个领域有没有先进的经验,一年可以生成多少篇精准的财经类报道,这些报道可不可以单独形成产品包,并针对这些海量信息做模型?


刘康: 我们不那么追求量。A股的2000家上市公司,平均每几天产生一篇稿子,一年下来就是几十万,上千万的稿子。量可以是很多的,但是我们刻意追求它的量。我们不希望上市公司的每一篇报道都通过机器人写作。我们在量的基础上要追求质,很多时候在看pdf公告的时候看得头昏眼花。你需要自己去找它的营收、利润率、净利润等等信息。那么我们能不能通过机器的手段精准地抓到它每一行数据,将它的数据作为一些定量分析,不求很完善,只是大概知道公司整体的运营状况,这对用户来说是有价值的。
来源:全媒派


http://m.zm518.cn/static/zhangme ... mp;isappinstalled=0







欢迎光临 传媒教育网 (http://idealisan.eu.org/) Powered by Discuz! X3.2