传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: admin
打印 上一主题 下一主题

新闻语言的语用案例

[复制链接]
1140#
发表于 2021-9-3 18:22:47 | 只看该作者
【案例】
上交所,深交所,北交所,所所套人;科创板,创业板,新三板,板板要命。横批:共同致负
编辑:李佳怿

1139#
发表于 2021-9-3 17:31:55 | 只看该作者
【案例】
上海一大学生为了显摆,在灯迷会上出了一则上联:上海自来水来自海上。顺念倒念完全一样,难度极大!声称是绝句无人能对。北京大学生对曰:香山碧云寺云碧山香。山东大学生对曰:山东落花生花落东山。山西大学生对曰:山西悬空寺空悬西山。湖南大学生的对子:湖南绣花女花绣南湖!安徽大学生对曰:黄山落叶松叶落山黄。江西大学生对曰:江西明月山月明西江。海南大学生也不示弱,对曰:海南护卫舰卫护南海。扫地大妈听了随口说到:三块五花肉花五块三……
注:语序
编辑:李佳怿

1138#
发表于 2021-9-3 17:31:12 | 只看该作者
【案例】



编辑:李佳怿


1137#
发表于 2021-8-29 09:42:47 | 只看该作者
【案例】
微软翻译又添新语言 —— 文言文

编者按:每当面对美好的时节、迷人的风景、优美的事物时,或许你也禁不住想借古抒怀,然而却发现自己的古文词库有些匮乏。不过,最近微软亚洲研究院的研究员们将 AI 技术应用在文言文/古文与现代汉语之间的双向互译,并已集成于微软 Azure认知服务以及多个微软产品中,用户可以一键将文言文翻译成现代汉语,以及微软翻译服务支持的其他90多种语言和方言。
在阅读古诗词时,我们常常惊叹于古人携风月入墨,落笔如画,仿佛世间最美的风景,都在古诗词和文言文中。比如,我们可以在“落霞与孤鹜齐飞,秋水共长天一色”中享受绝美,在“大漠孤烟直,长河落日圆”里体会苍凉,在“气蒸云梦泽,波撼岳阳城”中感受壮阔。古代文人对人、事、物、景的诸多描写,为我们留下了灿烂的文化瑰宝。
然而,当我们读到北宋词人柳永笔下描绘的清明节旖旎春色和社会风情——“拆桐花烂熳,乍疏雨、洗清明。正艳杏烧林,缃桃绣野,芳景如屏。倾城,尽寻胜去,骤雕鞍绀幰出郊坰(zhòu diāo ān gàn xiǎn chū jiāo jiōng)。风暖繁弦脆管,万家竞奏新声”,这些略显拗口的古文,对于大多数人来说理解起来不免有些困难,很难完全体会出诗人所表达的意境。


为了解决这个问题,微软亚洲研究院的研究员们通过采用最新的神经网络机器翻译模型和训练框架,实现了文言文/古文与现代汉语之间的双向互译,以及文言文与微软翻译支持的其他90多种语言和方言的互译。目前,文言文翻译已经集成到了微软翻译应用、Azure 认知服务的翻译工具 API,以及微软翻译服务支持的包括Office 在内的多个微软产品中。


让更多人领略中华传统文化的魅力

不少人与文言文的上一次“亲密接触”大概还停留在学生时代,有些甚至早已遗忘。近年来,无论是汉服文化的流行,还是九大博物馆联手让国宝活起来的《国家宝藏》,以现代音乐奏响经典诗词的《经典咏流传》,聚焦文化典籍的《典籍里的中国》等等,全新的展示形式让越来越多的人重新关注中华传统文化的魅力。

文言文是中华传统文化的重要载体。卷帙浩繁的古书、古文记录了中华五千年来博大精深的文化,其中沉淀、蕴含的思想和智慧,值得不断地探索与思考。因此,文言文对于传承和传播中华文化至关重要,正如想理解西方文化的精髓要从读懂莎士比亚开始一样。

有了机器翻译的帮助,游客们在游山玩水时可以看懂古建筑、古碑文上的古文和诗词,学生们在进行大语文学习时多了一个通过实践举一反三的工具,对于古籍的整理和翻译研究工作来说,也可以提升效率、事半功倍。

“从技术角度上,文言文可以看作是一个单独的语种,当文言文与现代汉语实现自由互译后,文言文与英语、法语、德语等语言的互译也就水到渠成,”微软亚洲研究院高级研究员张冬冬说道。届时,国际友人在阅读中国经典古籍时也能瞬间秒懂,了解更加原汁原味的中华传统文化。

文言文翻译 AI 模型的最大难关:训练数据少

人工智能模型训练最关键的要素是数据,数据体量足够大、质量足够高,才能训练出更加精准的模型。在机器翻译中,模型的训练更是需要双语数据:原文数据和目标语言数据。由于文言文翻译极为特殊,它并非日常用语,所以与其他语种的翻译相比,文言文翻译的训练数据非常少,并不利于机器翻译模型的训练。

尽管微软亚洲研究院的研究员们前期收集了不少公开的古今汉语数据,但原始数据却无法直接使用,需要通过数据清洗,对数据的不同源头、多样的格式以及标点符号、全角/半角等进行标准化的统一,尽可能减少无效数据对模型训练的干扰。这样下来,切实可用的高质量数据又进一步减少。据微软亚洲研究院研究员马树铭介绍,为了解决数据少的问题,研究员们做了大量的数据合成和增强工作,包括:

首先,共用字符对齐、扩展,扩大数据量。与英文、法文、俄文等其他语言的翻译不同,文言文与现代文有相同、共通的字符。利用这个特点,微软亚洲研究院的研究员们通过创新算法,让机器翻译通过对共同字符进行召回、自然对齐,再进一步扩展到词语、短语、短句,从而合成了大量可用的数据。

其次,句式变形,提升机器翻译的鲁棒性。针对句子、诗文不同的断句,研究员们增加了多种变形,让机器在古诗文学习方面更全面,例如,古诗《寻隐者不遇》,一般的断句方式是“松下问童子,言师采药去”。但对于人来说,即使是“言师采药去,只在此山中”这样非正常断句,看见时也知道它的上下句关系和意思。但对于没见过如此断句的翻译模型来说,就会“懵”,因此,通过数据格式的变形不仅能扩大训练的数据量,也能提升训练模型翻译的鲁棒性。

第三,繁简字互译训练,增加模型适应性。汉语言中,无论是文言文还是现代文,都存在繁体字。因此,为了提升模型的适应性,研究员们在训练翻译模型时,不仅有简体中文的训练,还加入了繁体中文的数据,以及繁简字夹杂的数据,让翻译模型都能看懂,翻译也就更精准。

第四,增加集外词训练,提升翻译准确度。在现代语言向文言文翻译时,还会出现一些集外词,也就是古汉语中从未出现过的新名词,如微软、电脑、高铁等近现代才出现的实体词。针对这样的“意外”,研究员们训练了一个小模型来识别实体,先将实体之外的意思翻译完成,再把实体填写回去,以确保机器对集外词处理的准确性。

此外,针对非正式文体,如博客、论坛、微博等非正规的文体,该机器翻译模型也都进行了针对性的训练,进一步提升了现代汉语与文言文之间翻译的鲁棒性。


张冬冬表示,“基于当前的翻译系统,我们还将在丰富数据集、改进模型训练方法上不断精进,使方法变得更加鲁棒、通用,未来或许不只是在文言文翻译中能够使用,还可以扩展到更多应用场景中。”


创新技术助力文化遗产的保护与传承

中华文明上下五千年的历史,由于时间和空间的限制,能够传承下来,又被后人了解和记录的内容很有限。多年来,微软亚洲研究院一直致力于将最前沿的技术和研究成果应用于历史、文化、考古等方面的保护和传承,让文化遗产以更直观、互动的方式展现在人们面前。

自2005年起,微软亚洲研究院就基于自然语言处理、机器学习等人工智能技术研发了微软对联系统,并逐渐增加了微软字谜和微软绝句。2010年,微软亚洲研究院与故宫博物院和北京大学三方合作完成了“走进清明上河图”沉浸式数字音画展示项目的研发,独创性的三维布局恢复算法和虚拟环境组织方法,让观众可以身临其境地欣赏画中的每个细节,不仅以新方式保护和传承了书画类历史文物,也给传统博物馆在新技术时代的发展带来启示。2011年,微软亚洲研究院向敦煌研究院捐赠了专门为敦煌莫高窟量身定制的“飞天号”十亿级像素数字相机系统,突破性地解决了敦煌壁画和佛龛数字化拍摄过程中的难题。

微软亚洲研究院还在积极探索与文言文专业研究机构的沟通与合作,期待从技术角度提升文言文翻译系统准确性的同时,也能够获得专业性的意见和建议。

最后,让我们来测试一下你的文言文底蕴到底有多深。请选出以下文言文语句的正确意思:

1
《陈情表》:诏书特下,拜臣郎中,寻蒙国恩,除臣洗马。
A:专门下达诏书,授予我郎中的官职;不久又蒙受国家恩典,让我去给太子洗马。(错误)
B:朝廷又特地下了诏书,任命我为郎中,不久又蒙受国家恩命,任命我为太子的侍从。(正确)

2
《鸿门宴》:臣死且不避,卮酒安足辞?
A:我死都不怕,一杯酒有什么可推辞的?(正确)
B:我喝死都不怕,一杯酒怎么够呢?(错误)

来源:微软研究院AI头条
链接:https://mp.weixin.qq.com/s/5cpBuUXfeb0r13JSyNuS_Q


编辑:蒋可心



1136#
发表于 2021-8-26 21:59:12 | 只看该作者
【案例】


编辑:马皖雪
1135#
发表于 2021-8-24 21:16:39 | 只看该作者
【案例】

编辑:马皖雪

1134#
发表于 2021-8-24 21:01:19 | 只看该作者
【案例】



编辑:马皖雪
1133#
发表于 2021-8-20 17:34:13 | 只看该作者
【案例】

编辑:何晓琴

1132#
发表于 2021-8-14 15:28:37 | 只看该作者

【案例】


语法


中国有两个体育项目不用看,不用担心:一个是乒乓球,一个是男足。

前者是“谁也赢不了!” 后者是“谁也赢不了!”。

前者是“谁也打不过”,后者是“谁也打不过”。


巧的是,打乒乓球出生的蔡振华当了足协主席。有人说蔡振华不懂足球还当足协主席,蔡振华怒了:你们公检法的懂法律吗?你们教育部的懂教育吗?你们证监会的懂股票吗?  我好歹懂个球!  你们懂个球?



编辑:王奕

1131#
发表于 2021-8-7 22:41:09 | 只看该作者
【案例】

东京奥运:中国记者称铅球冠军巩立姣是“女汉子”引发辩论


中国铅球名将巩立姣在上周日(8月1日)的东京奥运会女子铅球项目中夺得金牌,但一名官方媒体记者在随后的采访中将她称为“女汉子”,在社交媒体上引发了针对女性刻板审美的激烈辩论。

在中央电视台播出的采访中,体育记者陆幽称:“巩立姣留给我一个女汉子的形象。”“女汉子”是中国网络上流行的词汇,用于形容一名女性个性豪爽、拥有类似男子的气质。

在32岁的巩立姣回应称自己的内心“还是比较女孩子”后,这名记者再次追问她“对女孩子的人生有什么计划”。“因为你之前是女汉子,为了铅球,接下来可以做自己了吗?”记者问道。

巩立姣迟疑了片刻,随后表示:“如果真要说不练的话,可能就减肥,然后结婚生孩子吧。人生的必经之路。”

接下来的片段显示,摄影师问这位运动员是否有男朋友,陆幽则试图继续追问巩立姣在恋爱后,和男朋友掰手腕会发生什么。

“我不掰腕子,我很温柔的,”巩立姣回答道,并结束了采访。

这段只有一分多钟的采访一经播出便在社交媒体引来了口诛笔伐,很多网民批评该采访狭隘,并延续了一种对女性的“刻板印象”。

“白幼瘦审美还用奥运冠军身上了,人家怎么就不算女孩子,非要白幼瘦才算女孩子吗,”一名网友批评道。


微博上的一则漫画,讽刺一些人对于女性运动员“过于狭隘”。


“人家是世界冠军,为国争光了,你凭什么对人家私生活指手画脚,”另一名网友评论道。

在微博上,有关此事件的话题标签“#女性能被谈论的只有婚姻吗?”,点击量超过3.5亿次,产生了近16万条帖子。

还有很多网友在巩立姣的微博下留言,表达支持。

“我看了铅球比赛,每一掷都充满着美感,女人的价值不在于结婚生子,也拒绝对于女性的单一审美。看过采访,是幽默风趣可爱又有强大意志力的人,真的好喜欢,”一篇热门回复写道。

巩立姣周三(8月4日)也通过微博回复网友说:“完全说出我的心声!谢谢”。

中国央视没有对此作出回应,但一位熟悉该事件的央视员工试图捍卫记者的采访。这位要求匿名的员工对BBC称,记者对巩立姣的报道“只是央视体育频道的其中一个角度”。

该人士称,记者的本意是试图展现巩立姣在奥运冠军外的另一面,是希望“更完整和立体地报道巩立姣”。


女性运动员
铅球在中国并不是一个热门项目,但巩立姣的此次夺冠在中国引发狂潮。因为这不仅是巩立姣自己近20年职业生涯的最大突破,也是中国在奥运史上获得的首枚田赛项目金牌。

作为奥运会的“四朝元老”,巩立姣取得过2008年北京奥运会女子铅球季军、2012年伦敦奥运会女子铅球亚军、2016年里约奥运会女子铅球第四名的成绩。

此次夺金是巩立姣近20年职业生涯的最大突破。


在夺冠之后,巩立姣曾呼吁大家“多关注我们这些胖胖的女孩”。她表示,“铅球也是通过我们努力,一球一球扔出来的,无数次投掷才能取得我们想要的成绩”。
在中国,人们的审美标准曾较为单一,很多被推崇为美女的女性都有着苗条的身材和白皙的皮肤。

在2018年席卷全球的#MeToo运动的推动下,包括中国在内的很多国家对女性权利的意识得到提高,女性时常通过社交媒体发声,表达对于一些性别歧视和刻板印象的不满。

在今年东京奥运会上走红的中国女性运动员还有女子气步枪冠军杨倩,以及举重冠军侯志慧等,她们也都吸引了观众的目光。

在比赛时戴着小黄鸭发夹、涂着指甲油的年轻选手杨倩一人就拿下两枚金牌,受到很多中国观众的喜爱。但她的母校清华大学在社交媒体发文,号召该学校的“单身男生这边看过来,咱家的好姑娘”,随即受到很多网友批评“干预私生活”。

20岁的女射箭运动员安山(An San)面临更严重的网络攻击。


在韩国,20岁的女射箭运动员安山(An San)面临更严重的烦恼。虽然她一人夺得了三块奥运金牌,但由于她的超短发型而遭到一些韩国反女权人士围剿。在厌女情绪下,一些网民指责她是“女权人士”。



来源:BBC
编辑:古凤


发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表