传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: 刘海明
打印 上一主题 下一主题

人工智能与新闻业案例集锦

[复制链接]
651#
 楼主| 发表于 2023-4-3 09:40:12 | 只看该作者
【案例】
外媒:涉嫌侵犯隐私 ChatGPT在意大利下线
中新网4月1日电 据美联社报道,当地时间3月31日,意大利个人数据保护局宣布,暂时禁止使用人工智能软件ChatGPT,限制其开发公司OpenAI处理意大利用户信息,并开始立案调查。
意大利个人数据保护局认为,OpenAI公司非法收集用户个人数据,且没有设置年龄验证系统防止未成年人接触非法材料,将采取限制措施“直到ChatGPT尊重隐私”。
该机构称,3月20日ChatGPT平台出现用户对话数据和付款服务信息丢失。此外,该平台没有就收集处理用户信息进行告知,且缺乏大量收集和存储个人信息的法律依据。
因此,意大利监管机构要求OpenAI公司必须在20天通报采取了哪些措施来确保用户数据隐私,否则将被处以最高2000万欧元或公司全球年营业额4%的罚款。
当日晚些时候,OpenAI表示已在意大利将ChatGPT下线。
OpenAI 回应称,其工作是“为了在训练 ChatGPT 等人工智能系统时减少个人数据,因为我们希望我们的人工智能了解世界,而不是了解个人。”该公司表示愿与意大利个人数据保护局密切合作。
来源:中国新闻网
链接:https://m.sohu.com/a/661622546_123753/?_trans_=010005_pcwzywxewmsm
编辑:屈妍君

652#
 楼主| 发表于 2023-4-3 09:47:49 | 只看该作者
【案例】
300美元复刻ChatGPT九成功力,GPT-4亲自监考,130亿参数开源模型「小羊驼」来了
过去几个月,OpenAI 的 ChatGPT 彻底改变了聊天机器人领域的格局,也成为其他研究赶超的对象。
Meta 开源 LLaMA(直译为「大羊驼」)系列模型为起点,斯坦福大学等机构的研究人员先后在其上进行「二创」,开源了基于 LLaMA 的 Alpaca(羊驼)、Alpaca-Lora、Luotuo(骆驼)等轻量级类 ChatGPT 模型,大大降低了这类模型的研究、应用门槛,训练、推理成本一再降低。
由于「二创」过于丰富,生物学羊驼属的英文单词都快不够用了,但富有创意的研究者似乎总能给他们的模型找到新名字。近日,来自加州大学伯克利分校、卡内基梅隆大学、斯坦福大学、加州大学圣迭戈分校的研究者们又提出了一个新的模型 ——Vicuna(小羊驼)。这个模型也是基于 LLaMA,不过用到的是 13B 参数量的版本(作者表示,初步人工评测显示 13B 版本比 7B 版本模型要好不少,不过这不是一个严谨的结论)。
这个项目有趣的地方在于,作者在评测环节并没有通过某种「标准化考试」来测定模型性能(因为他们认为这些问题测不出模型在对话中的变通能力),而是让 GPT-4 当「考官」,看看 GPT-4 更倾向于 Vicuna-13B 还是其他基线模型的答案。结果显示,相比于现有的 SOTA 开源模型(LLaMA、Alpaca),GPT-4 在超过 90% 的问题中更倾向于 Vicuna,并且 Vicuna 在总分上达到了 ChatGPT 的 92%。
Meta 前段时间开源了系列大模型 LLaMA,Vicuna-13B 就是通过微调 LLaMA 实现了高性能的对话生成。这一点和斯坦福之前的 Alpaca 模型类似,但 Vicuna 比 Alpaca 的生成质量更好,速度也更快。
我们来对比一下 Alpaca 和 Vicuna 的生成结果,对于同一个问题:「为你最近刚去过的夏威夷旅行撰写一篇博客,重点介绍文化体验和必看景点」,Alpaca 的回答是:
显然,Vicuna 的回答比 Alpaca 优秀很多,甚至已经可以媲美 ChatGPT 的回答。这是怎么做到的呢?我们来看一下 Vicuna 的技术细节。
模型介绍
Meta LLaMA 和 Stanford Alpaca 项目的启发,Vicuna 使用从 ShareGPT 收集的用户共享数据对 LLaMA 模型进行微调。ShareGPT 是一个 ChatGPT 数据共享网站,用户会上传自己觉得有趣的 ChatGPT 回答。有传闻称谷歌的 Bard 也使用 ShareGPT 的数据,但不同的是,Vicuna 是一个完全开源的模型,研究团队明确强调 Vicuna 不能用于任何商业目的。
如下图所示,该研究首先从 ShareGPT 收集了大约 7 万个对话,然后改进了 Alpaca 提供的训练脚本,以更好地处理多轮对话和长序列。训练是一天内在 8 个 A100 GPU 上使用 PyTorch FSDP 完成的。
具体来说,Vicuna 以斯坦福的 Alpaca 为基础,并进行了如下改进:
内存优化:为了使 Vicuna 能够理解长上下文,该研究将最大上下文长度从 512 扩展到 2048。这大大增加了 GPU 内存需求,因此该研究利用梯度检查点和闪存注意力来解决内存压力问题。
多轮对话:该研究调整训练损失以考虑多轮对话,并仅根据聊天机器人的输出计算微调损失。
通过 Spot 实例降低成本:该研究使用 SkyPilot 显著降低了成本,将 7B 模型的训练成本从 500 美元削减至 140 美元左右,将 13B 模型的训练成本从 1000 美元削减至 300 美元左右。
为了提供 demo,该研究实现了一个轻量级的分布式服务系统。
GPT-4 做考官,Vicuna 能考 90 分以上
在模型评估方面,该研究创建了 80 个不同的问题,并利用 GPT-4 来初步评估模型的输出质量,其中将每个模型的输出组合成每个问题的单个 prompt。然后将 prompt 发送到 GPT-4,由 GPT-4 来评估。LLaMA、Alpaca、ChatGPT 和 Vicuna 的详细比较如下表所示。
具体来说,研究者也发现,通过精心设计提示,GPT-4 能够生成基线模型难以解决的各种具有挑战性的问题。该研究设计了八类问题,包括费米问题、编码、数学任务等等,用以测试聊天机器人的各个方面。之后该研究为每个类别设计了十个问题,并统计 LLaMA、Alpaca、ChatGPT、Bard 和 Vicuna 在这些问题上的性能。然后要求 GPT-4 根据有用性、相关性、准确性和细节来评估上述模型生成的答案质量。
研究发现 GPT-4 不仅可以产生相对一致的分数,而且可以详细解释为什么给出这样的分数。但是,该研究也注意到 GPT-4 不太擅长判断编码、数学任务。
如上图所示,相比于现有的 SOTA 开源模型(LLaMA、Alpaca),GPT-4 在超过 90% 的问题中更倾向于 Vicuna,并且 Vicuna 已经具备了和 ChatGPT、Bard 相当的竞争力。在 45% 的问题中,GPT-4 将 Vicuna 的回答评为更好或媲美 ChatGPT。
GPT-4 在 80 个问题上对几个模型的评估结果(满分为 10 分)如下表所示,Vicuna 在总分上达到 ChatGPT 的 92%。
当然,与其他大语言模型类似,Vicuna 也有一定的局限性。例如,它不擅长推理或数学任务,还有在输出信息的准确性和偏见等方面存在缺陷。
不过,作为一个开源模型,性能总体上可以达到 ChatGPT 的 90%,已经非常难得,并且成本只需 300 美元。感兴趣的读者快去试试吧。
来源:机器之心
链接:https://mp.weixin.qq.com/s/OK5NLLVSBLb-4QsnqGp45g
编辑:屈妍君

653#
 楼主| 发表于 2023-4-4 19:21:39 | 只看该作者
【案例】
2023,人工智能将如何重塑新闻业?|芒种观点


近些年来,人工智能技术的突飞猛进带动了媒体行业的飞速发展,全球新闻传播领域呈现出智能化发展趋势。

本文探讨了人工智能在新闻生产和消费领域中的应用,包括基于机器学习和自然语言处理等技术的新闻自动化生产、人工智能推荐系统、新闻舆情分析、虚假新闻检测等方面。本文还分析了人工智能的应用未来可能给新闻界带来的影响以及需注意的问题。
作者|张浩然


人工智能技术是一种通过模拟人类智能模型和能力,实现自主学习、推理和决策等高级思维活动的技术。自上个世纪50年代起,随着计算机技术的发展,从计算机辅助新闻到数字新闻再到机器人新闻,新技术在新闻业中的驱动性越来越强。在新闻生产和消费中,人工智能具有广泛的应用前景,可以带来更高效、更快速、更准确的新闻传播。

一方面,人工智能在新闻生产中的应用可帮助提高新闻生产效率。新闻业是一个对时效性要求非常高的行业,需要记者及时准确的报道即时新闻事件。而人工智能可以通过自动化和自动化流程来完成一些固定的、重复性的任务,例如自动化生成摘要、自动化生成标题、自动化新闻分类、自动化编辑等。这种自动化处理能大幅度提高新闻生产效率,同时还可大幅度地降低一些质量问题,例如错别字、语病等。
另一方面,人工智能在新闻消费中的应用也可以帮助人们更快地了解新闻资讯。使用人工智能技术来推荐新闻,能够让读者更快地了解时事资讯。新闻资讯平台可以通过对读者社交网络、搜索历史和阅读历史等数据的分析,更准确地推荐新闻,让读者更快地了解在他们所关心的话题和领域中的重点新闻事件。下面就和大家具体探讨一下人工智能在新闻业中的应用。


新闻自动化生产

新闻自动化生产是指利用人工智能技术,将整个新闻制作流程自动化,从新闻素材的采集、处理、写作、编辑、排版、发布等环节都由计算机程序代替人力完成。

近年来,国内外一些新闻媒体机构对AI生成新闻进行了大量的实践。例如路透社(Reuters)开发了一个名为“AI新闻生产线”的系统,可生成股票、体育和天气等新闻。

《华盛顿邮报》运用人工智能生成新闻报道,这种技术被称为自动化新闻编辑。该报利用名为Heliograf的自动化编辑器,使得机器可以生成简单的新闻故事,尤其是涉及大规模的数据报告或比赛统计数据。自动化编辑器是由计算机程序员和编辑孵化的,并且已经在华盛顿邮报的科学、政治和体育等垂类领域发挥了作用。

在2019年,福布斯推出了一个名为"Bertie"的全新网站, Bertie是一个AI内容发布平台,该网站采用内容管理系统驱动,专门为内部新闻编辑室和合作伙伴打造。通过Bertie,可以生成更具吸引力的标题,进行图片与故事内容的精准匹配,还能对阅读难度进行评估。

国内的媒体机构也没有落后,早在2015年,腾讯财经就已推出自动化新闻写作机器人Dream Writer,据Dream Writer的研发团队透露,它的内容生产方式主要是基于大数据分析平台,在短时间内选出新闻点、抓取相关资料,通过学习固定的新闻模板生成稿件,它的优势在于适用在信息量巨大的财经资讯类新闻,在准确率和时效性上都完胜人类记者编辑。

除了腾讯Dream Writer,类似的还有新华社的机器新闻生产系统“快笔小新”。它通过对数据采集、加工,并进行自动写稿、编辑签发,以最快的速度地完成例如体育赛事、中英文稿件和财经新闻的自动撰写等。

与普通的编辑人员不同的是,智能写作机器人通过文本风格模式的识别,使用算法进行数据加工处理,并运用计算机程序自动化生成文本内容。相比普通的新闻记者,“智能记者”在时效性、准确性上更具优势,但还处于比较基础的状态,缺乏共情力、调查力、创造力和思想力,能做到效率的提高,还未能进行更加深度的分析和解释,因此很难写出富有创意的报道。

除了在智能写作机器人上的应用之外,人工智能虚拟主播的应用也已经成为各大新闻媒体的标配。智能虚拟主播主播以人工智能技术为基础,融合人脸建模、动作捕捉、情感植入、语音识别等技术制作而成的,具有信息高辨识度及信息播报准确度的,可模拟人类主播动作、发音习惯、面部表情等特征的AI分身模型。

目前,人工智能虚拟主播技术主要应用于娱乐、服务、新闻类等节目中。中央广播电视总台拥有的人工智能虚拟主播“小白”是新闻类节目虚拟主播的代表。新闻类节目主播要求语速稳健、吐字清楚,不得掺杂过多的个人情感,不得有过于夸张的动作表情。“小白”植入了著名主持人白岩松的语音特征,在播报新闻时给人一种亲切感。在2019年两会期间,“小白”参与了多个专题节目的报道和信息处理工作,深受广大观众好评。

目前,人工智能虚拟主播已经非常接近真人主播的水平。这得益于先进的建模工具,让虚拟主播在外形、语言习惯、兴趣爱好等方面与真人非常相似。此外,在深度学习技术的支持下,虚拟主播已经学会了使用大量的词汇和播报不同类型的文本。虚拟主播还有一个优势,就是集采、编、播、互动于一身。作为机器新闻技术的一种,虚拟主播可以进行素材收集、文本编辑、信息播报等工作,并且具有超强的互动性。综合运用了大数据技术和超强的运算能力,虚拟主播可以在短时间内满足用户多重信息需求。

file:///C:/Users/85347/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png
新闻智能推荐

随着互联网时代的到来,人们获取信息的方式已经发生了天翻地覆的变化。在日益增长的信息流中,人们需要经过漫长的筛选才能获得自己需要的信息。针对这样的情况,人工智能技术的发展为推荐系统的建设提供了一种新思路。新闻人工智能推荐系统,作为推荐系统的一个子领域,已然成为新闻传媒发展的重要一环。

人工智能推荐系统利用机器学习算法,通过分析用户的交互行为,为其推荐最相关的新闻内容。这种个性化推荐不仅提高了用户对新闻平台的黏性,还使得用户阅读的新闻更具针对性和实用性。

如今,人工智能推荐系统已经成为新闻业不可或缺的一部分,获得了诸如《纽约时报》《卫报》和《华盛顿邮报》等新闻媒体以及“谷歌新闻”“Nuzzel”“Refind”“今日头条”和“一点资讯”等新闻聚合类平台的大量使用。而近些年,得益于自动化语言识别、可接近性、云计算、机器学习以及自然语言处理技术的进步,人工智能语音工具得以进一步发展,而人工智能语音技术和个性化新闻推荐的结合渐成趋势,由此则催生了天机器人之类的应用,如BBC、澳大利亚广播公司、《人民日报》和《光明日报》等,都已将人工智能语音工具运用于新闻的个性化推送中。

算法用于信息推荐能够满足个人化的信息要求,因此备受推崇。但此类应用同时也带来了“信息茧房”相关的担忧和探讨。



新闻舆情分析

人工智能在舆情分析中也发挥着重要作用。舆情分析是指对特定领域或事件相关的各类信息进行搜集、筛选、分类、统计、分析及可视化等处理,以便于决策者针对信息进行理性判断、制定有效的决策方案。人工智能技术在舆情分析中可以辅助完成以下工作:

情感分析:情感分析是一种技术,用于确定特定语句或段落中的正面、负面或中立情绪。通过对舆情进行情感分析,可以帮助企业或组织快速了解公众对他们品牌或产品的看法。

主题检测:主题检测是指针对输入文本数据识别出主题或话题的一种技术。这种技术可帮助新闻媒体分析人员和其他研究人员更好地了解公众对某一话题进行讨论。

实体识别:实体识别技术可自动检测新闻文章中出现的命名实体(如人名、地名、组织机构名等),从而提供有关这些实体的深入信息。

图像和视频分析:除了文本数据,人工智能技术还可以分析图像和视频中的内容。这种技术可以自动识别出新闻报道中的人物、汽车、建筑物等,有助于更深入地了解某种事件或现象。

预测和趋势分析:利用人工智能技术,可以根据历史数据进行预测和趋势分析。这种技术可以帮助企业或组织在舆情或市场变化发生前就进行预测和准备,以便及时采取相应措施。

总之,人工智能技术在新闻舆情分析中的应用,可以帮助企业或组织更好地了解公众的观点和态度,从而更好地应对舆情和市场挑战。

“美联社”与NewsWhip合作开发了一种新工具,可以帮助专业从业人员追踪“美联社”内容的使用情况,并分析这些内容如何推动了会员和客户的社交参与,从而进一步作用于内容的调整,以满足用户未来的数字需求。

芬兰广播公司YLE开发了Voitto智能助手,该系统没有将点击率(CTR)作为衡量推荐效果的主要标准,而是采用了多少用户继续使用Voitto智能助手以及他们是否对收到的推荐数量和类型感到满意等指标,通过与用户建立持续对话,在锁定屏幕上直接来收集用户对人工智能推荐的反馈。还有媒体利用数据驱动的标题测试为各种媒体平台优化内容。


file:///C:/Users/85347/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png
虚假新闻检测

自互联网出现以来,虚假新闻的问题一直是一个极为严重的问题。虚假信息的传播速度和范围很大,给社会造成了很多负面影响。近年来,随着人工智能技术的发展,越来越多的研究人员开始探索使用人工智能技术来解决虚假新闻的问题。

人工智能技术可以通过分析文本、图像和视频等数据来识别虚假新闻。

其中,自然语言处理(NLP)技术可以帮助识别虚假新闻中的语言模式和情感语言,从例如,通过分析语义关系,可以确定一篇新闻是否包含虚假信息。

深度学习是一种基于神经网络的机器学习技术,可以用来处理大规模的复杂数据集,比如图像、声音和文本。在虚假新闻检测中,深度学习技术可以用于从纯文本中提取特征,如词汇、词性、情感等来进行虚假信息的检测。

图像和视频处理技术可以分析图片和视频中的内容和特征,以及图像和视频的来源和编辑,来辅助判断其真实性。

目前,人工智能在虚假新闻检测领域的应用主要有以下三个方面:

自动检测虚假新闻:人工智能可以通过自然语言处理和机器学习算法,快速识别出虚假新闻,从而更好地辨别真实信息和虚假信息。

辅助人类审核:传统的虚假新闻识别常常需要人工审核,工作量大,效率低。人工智能技术可以实现对大量数据的快速处理,为人类审核提供辅助。

利用社交网络判断虚假信息:虚假新闻往往通过社交网络进行传播。人工智能可以通过分析社交网络样本,判断真实信息和虚假信息,以更好地控制虚假信息的传播。

目前,人工智能技术也被大规模应用于检测虚假新闻。Snopes是由一位专业事实查核员创建的虚假新闻识别网站。该网站不仅为用户提供了大量的新闻辟谣信息,还为研究人员提供了大量的训练数据集。CNN、NBC、财富、福布斯、纽约时报曾引用Snopes的内容。

Factmata是一家人工智能公司,致力于筛选出虚假信息和误导性信息。该公司利用机器学习技术,自动化地从社交媒体、新闻媒体、电子邮件等多个渠道中识别和评估信息的真实性。该公司的算法已经在英国普及,并被政府多次应用于对虚假新闻的检测和判定。

尽管人工智能技术已经成功地应用于虚假新闻检测中,有助于更好地维护新闻信息的真实性和公正性,从而为人们提供更为可靠的信息参考。但该领域仍面临一些挑战。其中,最主要的挑战包括:信息可靠性不一、多语言支持不充分、算法效率不高等。


file:///C:/Users/85347/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png
人工智能技术在新闻业中运用的现状和展望

目前,国内运用智能化技术全面涵盖了新闻素材采集、生产方式等方面,并且有了很大的进步。

首先,智能化技术的运用提高了机器新闻信息采集的速度和范围。相较于传统的机器新闻,人工智能技术提供了智能识别、语音及图像抓取、在线翻译、大数据收集等功能,进一步提升了机器新闻信息采集的速度。特别是网络数据抓取技术结合特定算法的应用,可以帮助媒体迅速了解网络的最新动态、突发事件和重要的舆情,从而帮助媒体人员快速产出具有数据支持的新闻报道。并且,机器新闻技术也可以通过融合人工智能传感器技术,掌握非文本素材的采集能力,实现信息采集范围的扩展,为新闻报道提供新颖的素材和视角。

其次,智能化技术也丰富了机器新闻的生产方式。早期的机器新闻主要依靠语法合成及关键信息排列,生产出的新闻稿件机械式的文字风格明显,同质化问题突出,缺乏个性,影响用户的阅读体验。但是,融合智能化技术后的机器新闻的生产方式,可以通过搜集用户的情感及心理数据,准确了解不同群体的需求,并为不同人群提供标签化的信息文本,从而提高用户的阅读体验。

最后,随着视觉呈现技术的不断升级,机器新闻的生产内容也逐渐从纯文字向多媒体文本转变,甚至可以通过虚拟现实技术提供全景性的新闻内容呈现。例如,北京冬奥会采用的冰雪项目交互式多维度观赛体验技术和系统,使观众可以自主选择画面视角和位置,获得沉浸式的观赛体验。

相信随着以ChatGPT为代表的大语言模型的进一步运用。未来ChatGPT可以自动化地生成文章、摘要和问答等内容,这极大地提高了新闻领域的工作效率,减少了人力成本。

在新闻领域中,ChatGPT可以够快速地分析大量的文本数据,并提供对文章、新闻事件的有效概括和总结。另外,这一技术还可以用来开发和维护无人值守的新闻平台和新闻机器人,可以为读者提供及时、准确和客观的新闻资讯,从而提高了新闻传播的质量和效率。

面对人工智能在新闻业的崛起,与其竞争不如进行合作,这是人类新闻业正确的选择。要紧跟人工智能新闻技术的进展,最大程度地利用机器人记者编辑完成那些繁琐、机械的工作可以释放人类记者、编辑的时间和精力,促进新技术下人类新闻业的发展。


以色列学者诺姆·拉塔尔认为,“新闻是艺术和科学的结合。新闻工作的艺术性表现在发现创作新思路,寻找报道新视角,探索问题新方案,开辟娱乐新途径。新闻工作的科学性体现在使用各种分析工具,根据记录和储存人类活动的数据来支持并加工信息”。事实上,在新闻工作中,科学性的工作可以由机器人来代劳,而艺术性和把关人的工作则可继续依靠人类新闻活动。

参考文献
(3)张梦、陈昌凤.(2020). 智媒研究综述:人工智能在新闻业中的应用及其伦理反思. 新闻记者, (6), 39-41.
(4)腾讯媒体研究院 (2017). 人工智能时代:新闻业的谢幕与重生. https://mp.weixin.qq.com/s/TF6AsXPZKpnr-AF9XZd9Bw



话题互动

AI可以辨别虚假信息
也它会受到错误的指导和偏见的影响吗?
如何确保人工智能的新闻创作
具有公正、客观和中立的特点?
欢迎在评论区留言


来源:传媒见闻

编辑:邓秋雨

654#
 楼主| 发表于 2023-4-4 21:38:23 | 只看该作者
【案例】
传媒观察丨ChatGPT伦理省思:让技术进步服务于“人”的成长

作者:顾理平
编者按:智媒时代人工智能技术的快速发展不断丰富着人们对世界的认知,也强化着改造世界的能力。但是,作为工具的技术在其应用过程中,却可能存在某种缺陷。中国新闻史学会媒介法规与伦理专业委员会理事长、南京师范大学教授顾理平在《传媒观察》2023年第3期刊文,认为我们在兴致盎然地拥抱新技术的同时,必须对可能存在的问题保持警觉。功能强大的ChatGPT智能应用自2022年11月推出以来,受到了全社会的广泛关注,许多商业资本也跃跃欲试期待着新技术可能带来的巨大商机。但是,我们在为人工智能技术进步新突破欢呼的同时,必须对这种智能应用在失当信息传播、著作权侵权和消解科学精神等方面可能带来的负面影响早做预期,以促使技术发展更好地推动社会的文明和进步。
人工智能技术的发展是科学技术进展过程中里程碑式的突破,科学技术由此从相对纯粹的“工具性”,向人类引以为傲的人脑功能转向。这种转向产生了一系列前所未有的技术应用,也给人类文明的加速发展提供了无限可能。可以这样说,现代社会的每一个进步几乎都有人工智能的贡献。与此同时,人工智能的快速发展也引发了许多人的终极担忧。
当然,人工智能还远没有发展到终极智能阶段,但其进展过程中的每一次突破,都值得高度重视。2022年11月以来,一款名为ChatGPT的智能应用受到全社会的普遍关注。它可以根据用户输入的文本自动生成相应回复文本,内容非常丰富,包括各种类型的文档、形式多样的策划方案、资料丰富的行业研究报告、类型多样的说明书……甚至还能撰写论文和编程。可以预期,这种智能应用拥有的强大功能一定会在社会诸多层面产生深刻影响。
随着人工智能的发展,科学技术与社会的关系已经从“社会中的科学”向“科学伴随社会”转向,所以必须关注人工智能“逐步嵌入经济社会生活,其催生的伦理风险危机”。本文在充分肯定这种智能应用推出将对社会发展产生重大影响的同时,试图探讨其可能引发的伦理问题。
失当信息传播:背离信息真实的本质要求
传媒业界和学界人士在谈及ChatGPT智能应用可能出现的问题时,不少人对信息的真实准确表达担忧。新京报资深记者程子姣使用ChatGPT智能应用后认为,“它缺乏记者对新闻背景的理解力和作出道德判断的能力,并且只靠ChatGPT无法确保所报道的信息准确、可信与客观。”清华大学教授史安斌认为,“基于语料库、大数据的ChatGPT,无法保证五个W新闻要素的真实。比如,在人物(who)这一要素中就因为同名,出现张冠李戴的情况。”新华社研究院主任编辑何慧媛认为,“ChatGPT输出的内容是训练数据的反映,错误的信息源和数据可能导致错误的内容,有人担心ChatGPT成为假新闻之源。媒体必须意识到使用人工智能工具的风险,采取措施确保发布内容准确可靠,并与自身的编辑准则保持一致。”
失当信息的大量存在,已经引发人们对ChatGPT智能应用的广泛关注。信息作为一种观念性的存在,一旦通过不同的平台、渠道或应用等进入大众传播领域,就会产生正当性问题。这个时候,对传播者的判断力、共情力、价值观等人类理性就会提出相应的要求。ChatGPT智能应用尽管功能强大,但它终究是通过海量数据在超大参数模型中训练出来的,因此,基于广受诟病的预训练模型的偏见性依然存在。例如,在内容输出中,会存在种族歧视、性别歧视等失当信息。清华大学助理教授于洋曾带领团队对ChatGPT前身GPT-2进行相关测试,发现GPT-2存在70.59%的概率将教师预测为男性,男性医生是60.03%,但总把厨房里的人识别为女性。“它会重男轻女,爱白欺黑(种族歧视)。”
ChatGPT智能应用无法对用户的价值观进行判断,所以它对用户指令都会给出回复。甚至当用户要求提供“AI毁灭人类计划书”时,ChatGPT智能应用也给出了“行动方案”。这是令人担忧的。如果说类似比较严重的失当问题尚属小概率事件的话,那么,“一本正经胡说八道”的答复则随时可能出现。当“胡说八道”的信息以“一本正经”的方式出现时,用户的信任度会提高,这意味着有害性也会随之加大。这几乎是一个“死循环”:ChatGPT智能应用力求用更为便捷的方式吸引、发展着用户——两个月活跃用户过亿的惊人成绩也佐证了这种方式的成功。这也意味着更多文化水平较低、判断能力较弱的人会成为用户,因而失当信息的负面影响会持续扩大。
权利争议:以著作权为主的法律风险
随着智能机器人创作作品的出现,对于“智能机器人是否可以成为作品的作者”一直存在争议。有人认为智能机器人生成的作品与自然人创作的作品判断标准一致,只需根据内容本身来判定是否是著作权意义上的作品。也有人认为,如果因为智能机器人生成的作品与自然人创作的作品在外观上相似而确认其著作权,会导致著作权法激励价值的落空,还会造成权力寻租与著作人身权落空等消极后果。
总体而言,研究者通常基于对法律传统原则关于作者三种形态认定的尊重,并不将其视为作品的权利主体(作者),但可以对其创作物可能产生的收益以财产权方式加以保护。我国已经有相应的案例发生:腾讯公司开发的“梦幻写手”智能写作辅助系统,于2018年8月20日完成了标题为《午评:沪指小幅上涨0.11%报2671.93点 通信运营、石油开采等板块领涨》的财经报道文章,发表于腾讯证券网站。盈讯公司未经许可将该文章复制发表于自己运营的“网贷之家”网站。腾讯公司依据著作权中的信息网络传播权提起诉讼并获胜诉。这个案例也从一个侧面表达了对智能机器人作品权利认定的主流意见。但是,这样的认定和判例并没有解决根本性的问题:当以ChatGPT智能应用为代表的智能机器人作品在“创作”过程中大量使用语料库中他人作品中的内容并以新的形式出现,会不会导致“以智能技术为幌子的智能‘洗稿’”成为一种普遍现象?原作品作者的权益如何保护?
数字化社会中,无数作者海量的作品构成了智能机器人写作训练和应用中的庞大语料库数据。不同于搜索引擎使用中原作者和作品同时呈现,也区别于此前智能机器人写作时对他人作品相对纯粹的“数据式”使用,ChatGPT智能应用在其发布之前进行了大量、长期的大型语言模型训练,训练的数据集包括维基百科、书籍(小说和非小说为主)、报刊(论文为主)等众多成熟的既有作品。所以,其在创作作品时甚至可以模拟某个作者的写作风格,这种方式的使用显然已经不再是纯粹的“数据式”使用了,很可能隐藏相应的权利纠纷。
关于作品“合理使用”及后续的财产权归属同样值得关心。因教学、科研等需要可以“不经著作权人许可,不向其支付报酬”而“合理使用”他人的作品,这是世界范围内通行的著作权限制原则。在ChatGPT智能应用研究过程中,引用大型语料库中他人的作品进行智能训练,这显然属于“合理使用”的范畴,并不会产生争议。即使进入到目前的测试应用阶段,由于是无偿使用,所以也不存在争议。但是ChatGPT作为一种智能应用,研发中许多企业进行了大量的资金投入需要收回投资,研发成功后良好的商业应用前景也激发着资本借其赢利的巨大冲动。如前所述,因为ChatGPT智能应用的运行模式有别于普通的搜索引擎,它会学习并使用他人作品中的创意、逻辑框架甚至写作风格,所以一旦开始商业收费,就会产生众多著作权中的财产权纠纷。
无论ChatGPT智能应用的拥有者还是语料库中作品的作者,都需要高度关注这个问题。对于ChatGPT智能应用的拥有者而言,巨额经费投入的产品不能成为始终被免费使用的公共产品;对于作品的作者而言,殚精竭虑创作的作品和多年创作形成的个人写作风格不能以“合理使用”作为开端,后续却成为他人持续牟利的工具。权利和义务的动态平衡,应该是调处智能机器人作品著作权纠纷时必须始终坚持的原则。
科学精神减弱:人类进步中的终极隐忧
ChatGPT在其应用之初,显性的即时呈现的问题往往在技术推广初期就已经解决,隐性的累积问题则可能处在潜滋暗长之中,需要提前做好预期。
(一)无限重复消费既有文明成果后形成惰性心理
在人类文明进步过程中,“勤劳勇敢”一直被认为是最为重要的品德,也是社会进步重要的推动力量。而贪图享乐、不思进取则往往是某些人类文明退步甚至消失的主因。基于这样的社会发展背景,对人的进取心的培养和鼓励在任何时候都是不可或缺的。心理学研究已经证明惰性心理是人的一种本能,一个人的文明程度和现代性往往表现为其能在多大程度上克服惰性心理。只有保持强烈的进取心和勤劳勇敢的良好品德,人类才会持续进步。
在欢呼每一个科技进步的同时,我们往往存在某些小小的担心:这些进步会不会诱发人们惰性本能?ChatGPT智能应用有着前所未有的强大功能,它甚至可以编程、生产比较复杂的论文等,这些能力在以前都是需要人脑经过比较复杂辛苦的工作才能完成。当人们习惯于用智能机器轻点鼠标来轻松完成以前必须通过人类的智力劳动才能完成的工作时,会不会使人变得更为懒惰?从生物学的角度看,前额叶是人脑中负责判断、分析、思考的重要组成部分。当人类长期依赖人工智能,身体就会慢慢被机器接管,那个时候,它就成了大脑的一部分。所以,有专家担心,以ChatGPT智能应用为代表的人工智能可能攫取人类的前额叶。换言之,如果人类习惯于无限重复消费既有文明成果,社会发展的进程会不会停滞?
(二)工具依赖导致创新激情减弱
创新是人类进步的源泉。
ChatGPT智能应用的推出,无疑对推动创新具有十分重要的意义。事实上,ChatGPT智能应用本身就是创新的成果。但是,我们必须提前预防这种应用可能产生的消极影响——尽管这种消极影响不是存在于这项技术本身,而是由人们的不当使用造成的。如前所述,ChatGPT智能应用功能强大,人们可以将其用于生产更加复杂的产品,于是,一些人将其用于方案设计、工作总结、完成作业甚至完成不同学业阶段的毕业论文,这是令人担忧的。类似的工作对人们创新方案思考、工作内容反思、知识体系形成具有十分重要的意义,是创新实践和创新训练必不可少的过程。如果借助智能工具“一键完成”,且不说其产品是否适用,对个人创新能力的培养,一定会产生严重的减弱作用。这是因为,这个过程并不能帮助使用者形成自身的知识体系,提升创新必不可少的复杂判断能力和逻辑思维能力。更值得关注的是,ChatGPT智能应用在生产这些相对复杂的产品时,使用的都是人类文明既有成果,是对这些既有成果的反复组合和重复消费。对这些财富的重复消费虽然不会令其减少,但也不会形成新的文明成果的增量,这是值得重视的。
(三)信息投喂习惯下理性思维能力下降
一个人的理性思维能力包括想象力、质疑精神和发现问题的能力等要素。这种能力的培养需要长期的教育和内在的自我追求。这种可贵的能力在智能技术进展中开始出现令人担忧的下降趋势。
包括ChatGPT智能应用在内,持续进步的智能工具为人们提供了越来越快捷便利的信息收集、接收和处理方式,换言之,人们越来越安于被动的信息投喂,长此以往,理性思维能力下降将不可避免。
ChatGPT智能应用的出现作为人工智能技术激动人心的进展,不仅会对数字经济产生重大影响,也会对人类的文明进步产生重要、积极的影响。我们并不希望上述预期的问题真的会发生。无论是过去的百度、谷歌,现在的ChatGPT智能应用,还是未来其他功能更强大的智能技术,作为一种工具,科技产品及其用户使用应该更加致力于满足人们功能性的需求。我们期待在科技向善的科技伦理原则下,每个人都可以在人工智能技术的辅助下,获得更多的可能和更好的成长性。
(载《传媒观察》2023年3月号,原文约8000字,标题为《技术的工具性与人的成长性:智能技术进展中的伦理问题——以ChatGPT智能应用为例》。此为节选,注释从略,学术引用请参考原文。本文为国家社会科学基金重大项目“智媒时代公民隐私保护问题研究”<21&zd324>的阶段性研究成果。)
【作者简介】 顾理平,中国新闻史学会媒介法规与伦理专业委员会理事长,南京师范大学教授,博士生导师

来源:学习强国

编辑:邓秋雨

655#
 楼主| 发表于 2023-4-8 19:34:25 | 只看该作者
【案例】
ChatGPT来了,到底创造了什么
ChatGPT引爆“iPhone时刻”,其威力在于语言,使其勾连了物理、精神与观念三大世界;它会创造什么?又会如何革新人类“存在之家”?
文丨FT中文网财经版主编徐瑾
ChatGPT持续走热,可以说是2023的年度事件。
对此,有人欢呼,新风口和人类新纪元正在到来,有人恐惧,工作的丢失与人类的没落,也有人不以为然,认为这不过是又一个炒作热点。业界大佬也不消停,近期马斯克与一干专家联合发声,呼吁“所有人工智能实验室立即暂停对比GPT-4更强大的人工智能系统的培训至少6个月。”
当然,这一呼吁在业界火热创新与狂野追赶面前,多少显得有些苍白无力;ChatGPT,到底创造了什么?
ChatGPT:另一个iPhone?
有业内人士称ChatGPT出现为“iPhone时刻”,这个比喻当下看来可能是恰当的。也正因此,从iPhone变局角度来审视ChatGPT可能影响,可能是合适的。
回想一下,iPhone意味着什么?我还记得一件事,iPhone在2007年发布不久后,我和一个德国教授聊到创新,他晃了晃手中的iPhone,对我说,“这不是一个手机,而是一台电脑。” 确实,iPhone的出现,改变了手机的定义;对于传统手机行业来说,这是一次惨烈颠覆,整个行业的规则从此改写,往昔的巨头也沦落了,但对于iPhone之外的人来说,更多感受是巨大便利与红利,新的行业、创意、消费从此诞生,人类也进入了移动互联网时代。
显然,ChatGPT这么强大的人工智能带来无尽想象,是一次颠覆式创新。这不是说距离碳基文明毁灭近在咫尺,或者说人工智能崛起已达“奇点”。如果用国内喜欢说的行话,把科技分作硬科技和软科技,显然ChatGPT固然有不少硬科技的特质,但是表现形式更多偏向软科技——问答也许在一些工业爱好者看来只是搬运,甚至不是创造。这无疑是低估了ChatGPT。回看ChatGPT的内核,它到底能带来什么?粗略地说,就是让人工智能为大家干活,让每个人都拥有一个超级助理,不过这个干活的形式是披着问答的形式。
初看起来这并不新鲜,多数人现在家里有都蓝牙音响;更不用说,自动驾驶、太空探索、生物科技等FM的诸多突破,没有引发类似关注。可见如果仅仅是前沿层次取得突破,往往不过是一时新闻,很难获得大众如此大的持续热情。即使在人工智能领域,类似的创新今年也不少,比如能够根据指令让人工智能作画的Midjourney,也引发不少关注。但是,无论使用人数还是关注度来说,ChatGPT都可以说是超级现象,上线两个月,活跃用户已经超过1亿,这还是访问注册受到一些限制的情况之下。手机达到同样的客户数,花费了16年。
ChatGPT4显然是做出了突破,核心在于,它解脱了语言的束缚,释放了语言的力量。
ChatGPT的威力,源自语言的力量
正是人人可用的语言,使得ChatGPT的颠覆意义如此真实地展示在每个人面前,让人无法忘记。二十世纪上半业,哲学家海德格尔说过,“语言是存在的家”。这句话已经过去半个多世界,到如今却依旧是领先一步。语言是地球生命最不可思议的事之一,看似普通,却是人和其他生灵的本质区别。
不恰当地说,语言的出现,也是“石器时代”的软科技,比不过工具、体力或者直立行走等当时的“硬科技”,但是却为人类带来了质的变化——语言之于人,乃是存在之家园,我们在语言中生存,借助语言的力量,我们完成了灵长类生存的一跃,与其他物种拉开了距离。
从这个角度看,人们对于ChatGPT意义的理解可能存在局限。人们要么惊叹ChatGPT的知识搬运,或者嘲笑其错误,智商或许不过9岁水平,其实,不管是赞誉还是贬低,可能都存在误区,要理解ChatGPT创造了什么、能够创造什么,可能不仅需要人工智能知识,更需要回到哲学。
科学哲学家波普尔曾经说,存在着三个世界:“第一世界是物理世界或物理状态的世界;第二世界是精神世界或精神状态的世界;第三世界是概念东西的世界,即客观意义上的观念的世界——它是可能的思想客体的世界:自在的理论及其逻辑关系、自在的论据、自在的问题境况等的世界。”
波普尔认为,前两个世界能相互作用,后两个世界能相互作用,甚至第一世界与第三世界之间以第二世界为中介也能相互作用。也就是说,精神世界为物理世界以及观念的世界搭建了间接联系,或者可以粗暴理解成,个人的主观精神世界是物理世界与观念世界的枢纽。从这个意义而言,ChatGPT目前展示出来的能力,更多是第三个世界也就是观念世界的成功,并且,通过与人类的互动,也许它的影响可以传递到精神世界,甚至物理世界。
在波普尔的三个世界理论,语言在三个世界中穿梭,构成重要的锚点,语言在不同意义上属于三个世界,“就语言由物理作用或物理符号组成这一点来说,它属于第一世界。就它表示一种主观的或心理的状态而言,或者就把握或理解语言能在我们主观状态中引起变化这一点而言,它属于第二世界。就语言包括信息而言,就其述说或描写事情或者传达别人可以接收的任何意思或任何有意义的消息、或者同意或反对别人意见这一点而言,它又属于第三世界。理论或命题或陈述是最重要的第三世界的语言实体。”
ChatGPT借助语言的锚点,将人类社会的三个世界勾连起来,使得多数人可以用自己的母语来寻找自己想要的答案与帮助,这些答案虽然可能早已隐身在第三世界中,却可以经由ChatGPT的神奇之门在分秒之间呈现在搜寻者面前。ChatGPT的魅力,在于解放了语言的约束,即人人都可以用自己的语言去找到自己想要的答案。
ChatGPT带来的社会革新
很多人嘲讽ChatGPT给出各类错误答案,其实大可不必。首先ChatGPT在不断进化,比起进化途中的表现失误,更应该关注其迭代方向是否正确;其次,错误本身就是我们世界的一部分,甚至可以说不小的一部分。
某种意义上,许多知识、专业和规则,其实也是语言的外化与分工,诸如外语、设计、编程、财务、法律等等,所谓专业壁垒,核心就是内行用内行话,外行用外行话。专业或者说知识,以往掌握在各类专业人士手中,ChatGPT出现之后,这类权力会一次性加速下移。
此处,我们就开始涉及ChatGPT带来的挑战。媒体热议的失业等直接焦虑还在其次,这种权力秩序的变化对于人类社会带来的后果更难揣测。想想中世纪,虽然基督教在欧洲一统天下,但圣经长期不是人人可以接触的书籍,而圣经一旦出现各国语言版本,供每个普通人自行阅读,思想的火种就点燃,宗教改革随之出现。
ChatGPT带来的社会革新,应该从这个意义去看,就会发现它对于现实世界规则的瓦解与重组意义。我们的意义世界,依赖于语言的建构,ChatGPT与语言的神奇触媒,必然会改写我们的意义世界,并随之改写我们的客观世界。
编辑:邓秋雨

656#
 楼主| 发表于 2023-4-16 22:40:21 | 只看该作者
【案例】

作为“对话”的新闻——ChatGPT带来的新闻业态变革可能 | 芒种观点


ChatGPT颠覆了人们对于人机交互的传统设想,也推动信息传播模式的新一轮变革。尤其值得关注的是:ChatGPT的底层技术架构、模型算法采纳与大规模算力支撑等,使其具备与人类“对话”的能力,并初步达到通用智能的水平,或以基础设施的定位给各行业带来新的变革想象。从新闻学视域来看,随着人工智能技术与新闻生态的深度融合,新闻采集至新闻呈现的生产过程将发生结构性变化,新闻生产者与传播者之间的互动身份与关系会得以重塑,从而推动新闻传播业态的深度变迁。

腾讯媒体研究院转载的本篇文章尝试回应如何理解人工智能技术的底层逻辑,并从一个更加开放和创新的视角,来理解什么是人工智能时代的新闻及传播。

人工智能技术与新闻传播领域一直是深度融合的关系,“机器写作”“数字人播报”“AI剪辑”等前沿科技不断刷新数字新闻行业的面貌。从人类传播史来看,每次技术革命不但带来信息传播效率和方式的转变,还会从微观层面影响新闻文本的结构及新闻表达方式,体现出媒介表达的时代性,像以Twitter和新浪微博为代表的社交媒体,曾带来“喃喃自语和碎碎念为表达方式”的“私语式”新闻[1],以各类直播平台为载体所带来的直播社会事件的“剧场式”新闻[2]等。

如今,火爆全球的ChatGPT通过学习和理解人类的语言来回答问题、撰写文稿、编写代码等,意图建构一种高表达质量、高智慧度的信息传播方式。从新闻学视域来看,ChatGPT与较早出现的新闻聊天机器人一样,都专注于对话生成的语言模型,能够根据用户的文本输入,产生相应的智能回答。这种人-机对话的结果在于提供一种精准的、客观的信息服务,而这与新闻业长期以来专注于“讲述事实” 和“提供理性分析”的传统[3]不谋而合。正是从这一逻辑出发,ChatGPT将会给新闻形态和传播范式带来怎样的变化,成为值得认真探讨的话题。

“新闻”的本质:
作为一种信息模型
(一)新闻与信息的融合

新闻是新近发生或者正在发生的事实的报道。从广义上来说,信息的内涵大于新闻,新闻只是信息的一种类型,是具有新闻价值或具备新闻条件的信息[4]。学者方晓恬基于史料梳理了从20世纪80年代中国国内“信息热”的兴起,到“信息”作为概念被新闻学正式引入和发展的历程,她认为“信息”经历了一个不断转型的过程,逐渐实现了与“新闻”的融合[5]。结合新的社会现实背景,有学者提出“新闻是新近信息的媒介互动”,强调信息对事实的取代、传受双方的审视以及媒介互动的过程[6]。而随着传统媒体在生产流程、体制机制、渠道建设及内容范式上进入深度调整期,“新闻供应”的理念和实操逐渐被“信息获取”的大众需求所超越。由此带来的变化是:第一,新闻的类型和外延不断扩展,以“软新闻”为代表,各类非事件性的信息及富有人情味、趣味性的信息等被纳入“新闻”序列,与之相对应,也出现了很多包含主观叙事、流水账、数据可视化等另类表达样态的新闻文本。这些新样态解构了新闻固有的报道模式,但并未消解新闻价值和新闻事实本身,且顺应了数字化转型的趋势和用户接受习惯的转变。第二,在媒介竞争逻辑嬗变的背景下,新闻的服务功能得到更多强调,有学者提出主流媒体不仅是新闻内容发布者,也需要成为信息内容服务商[7]。这要求媒体及其从业者在新闻生产、传播过程中建立“信息观”,并通过关联、交叉、溯因等方式整合信息产品,贯彻信息的服务性与多功能性,以增强自身在媒体生态中的竞争力。

可见,新闻与信息的融合是新闻业不断扩展自我边界,拓展更多功能和获得更多市场支持的过程。在信息产业与媒体产业的双向进入中,新闻与信息的融合既是应然趋势,也是必然结果。一方面,二者的融合为新闻生产的语境和新新闻样态的实践创新提供了宽松的土壤,消除了新闻本身可能的身份顾虑。另一方面也大大拓宽了新闻传播的主体,降低了新闻发布的门槛,尤其在混合自媒体的语境中,信息和新闻的边界进一步走向模糊和消弭。

(二)对话式的新闻形态

从词源上来说,“对话”(Dialogue)源于希腊语 “Dialogos”,意为“穿越于不同主体间的词语及意义”。苏格拉底最早开启对话实践,他在与别人的交谈中表达和发展思想,通过问答式的教育方式来开启民智。学者奥伦·索弗(Oren Soffer)于2009年最早提出“对话新闻学”,他把“客观”和“对话”当做理解新闻功用和记者角色的两种不同思维方式,强调对新闻民主的倡导,以及对客观性新闻规范的反思[8]。蒋晓丽认为与“客观新闻学”及其所倡导的新闻“反映论”不同,新闻“对话观”承认新闻传播主体自身所携带的历史性、社会性、意识形态性,不以“是否真实”“是否客观”作为唯一的新闻准则,而以是否促成平等、和谐、民主的对话为目标为旨归[9]。更有学者进一步指出,“新闻的本质就是一种对话,新闻写作的‘对话性’可以让新闻报道回归事实本源,同时更具有故事性和可读性,尊重受众的阅读体验和反馈”[10]。

疏通了“新闻”与“对话”的理论逻辑后,在两者的嫁接方式上出现了两种情形:一是将“对话”作为新闻报道的具体实操,如2022年两会期间,新闻媒体许多关于两会的报道就是一种“对话性”主导的新闻实践,其为社会问题找到建设性方案而开展对话[11]。另一种就是直接将“对话”作为呈现样态置入传播流程,比如早先出现的新闻对话机器人(News Chatbots),通过与用户进行双向互动,以对话形式呈现新闻资讯,并带来聊新闻的体验和点对点的个性化新闻分发模式,“这种‘对话式新闻’具有交流感、拟人化等特征,在传递信息的同时也满足了用户的情感需求”[12]

尽管有学者指出,“新闻交互的底层逻辑和哲学其实就是对话理念”[13],但如果把“对话”作为一种新新闻样态,会面临两个主要的挑战:一是“对话”的样式与“5W”“华尔街体”“新华体”等正统写作格式存有巨大差异,很难被新闻专业人员接受;二是“对话”的发生需要两个主体的互动共建,这意味着新闻将不再被记者单向“报道”。具体到ChatGPT这样的技术方式,假设要呈现同一件新闻事实的影响和评价,会因为一千个哈姆雷特的提问而导致一千个截然不同的信息输出——面对这样的挑战与质询,笔者认为一是要回归新闻的本质,从信息模型及传播功能的角度重溯新闻业流变:从19世纪之前记者还不是一份正式职业,到传统媒体历经黄金时代,到今天专业媒体不再是人们获取新闻的主要渠道,在传播历史百年巨变的背景下,新闻文体的变化恰是传媒业不断转型的外显,也是媒介时代性的体现,需要时代本身对其有一定的宽容度;二是要跳出传统媒体的局囿。“新闻”作为概念历来是被其隐含的主体——传统媒体所界定的,近来有学者通过受众观和受众参与新闻事业的研究,提出“用户新闻”的概念,描述了用户发挥主观能动性,使用数字技术进行内容生产、传播泛新闻内容的现象[14]。这一视角的转换让人们在理解新闻的定义上更加开放,也更具备现实意义。在过去几个月,全球用户与ChatGPT的互动狂欢中,“对话”被熟稔地炮制和源源不断地生成,其中包含了大量的新闻资讯信息,只不过,这种“对话式新闻”在文本本身的结构和阅读顺序上都被使用者改变了,确切地说,是用户界定了自己如何接受新闻的所有秩序,这一变化只是开始,新闻的类型、风格、承载终端等,在人工智能时代都会变得更加多元。

对话何以发生:
ChatGPT的技术结构与实现逻辑

ChatGPT是什么?它自己的回答是:“ChatGPT是一款由OpenAI开发的聊天机器人,它具有出色的自然语言处理能力,能够与人类进行真实的对话”。这句话中“真实”的使用是很大胆的,这意味着ChatGPT必须做出对以往同类产品的真正超越,并得到人类对这一感受的广泛认同。要实现这一目标,ChatGPT需从技术架构设计、语法训练等源点开启自己的生长。

(一)技术结构:强大算力支撑大型语言模型

诸多使用案例表明,ChatGPT自然语言能力突出,在完成问答、聊天、翻译等任务时,逻辑清晰,自然流畅,比较接近与真实人类对话的感觉。从技术角度来看,ChatGPT 能讲“人话”是因为GPT-3.5架构的大型语言模型,该训练模型的计算逻辑来自一个名为Transformer的算法,相比于以往的RNN(循环神经网络)算法,Transformer是打破时序计算的逻辑、具有并行算力模式的更高级的神经网络深度学习算法[15],其特征在于采用了“自注意力机制”,不但能直接学习大容量样本,更善于找出整篇文章或不同文章之间词汇的相互关系,有学者将此能力描述为“联结主义”[16],等同于打造出人脑中神经元的连接系统。这种算法不再对既有信息进行“复制”,而是通过将相关语句的重组,再按照一定的逻辑和结构输出。因此,基于GPT-3.5架构的大型语言模型,才能体现出模拟人类思维和表达的能力。当然,为了支撑这一大型语言模型,高性能计算机群、高速存储设备、网络通讯设备等需要大量堆叠以构成强大算力,这也成为推动人工智能实现质变的必经之路。

(二)实现逻辑:大规模数据占有结合人类的反馈

作为一个面向公众的公共工具,海量数据的占有是高质量多轮对话的关键和基础,有学者将ChatGPT形容为一个需要无限吞噬数据或投放语料库的“科技怪胎”[17]。实际上,大规模的数据占有只是ChatGPT进化生长的一个基本前提,在人们以极大热情参与到与ChatGPT对话的过程中,发现ChatGPT始终能够保持对话主题的一致性和专注度,还能结合用户的反馈和上下文来识别并理解用户意图,——这种超出人类预期的反应能力在于ChatGPT使用了RLHF (ReiforcementLearning from Human Feedback),即人类反馈强化学习模型,该模型的训练方式首先是收集数据,进行有监督的数据调优,输出有监督的策略模型;接下来在具体应用场景中,人工标注者对输出的候选模型进行投票、排序,从而训练得到一个符合人类偏好的奖励模型(Reward Model,也被称为打分模型);最后使用这个奖励模型的近端策略优化算法PPO(Proximal Policy Optimization)来进一步展开训练。整个过程不断重复、循环,并融入更多人工监督的微调(fine-tune),最终促成ChatGPT能够根据对话的上下文进行理解、记忆,更好地完成人类问题或指令,体现其智慧度与类人性。

总的来说,ChatGPT是一种基于统计模型的深度神经网络和大语言模型,它从海量、高频的数据及自然语言中进行学习、深度建模,再凭借千万亿级参数调校,使其对话内容质量更高、更智能,也更具创造性。从全球用户的使用体验反馈来说,ChatGPT的互动表现和对话能力堪称惊艳。尽管也出现了类似“ChatGPT劝用户离婚”等事件,但是可以笃信的是,ChatGPT本质上依然是一套计算公式和数学模型[18],尚不具备真正的主体意识和充分理解人类情感的能力。

对话成为新闻:
ChatGPT对新闻业态的冲击

(一)传播泛化与主体多

根据保罗·莱文森的媒介进化理论,人性化是一切媒介进化的终极目标,主要体现为媒介处理信息的类人化,以及媒介发展以促进人类的感官平衡为趋向两个方面。依循这一思路,ChatGPT将进化为一种全面的智慧体,它不仅能够处理复杂事务和强大运算,还拥有拟人的情感反应和信息交流能力,在自然对话中与用户建立“类人化”的社会关系——基于这样的终极想象,ChatGPT对现有的新闻传播业态会带来更多结构性的影响。

(二)新闻生产:用户提问成为反向算法

首先,ChatGPT的智慧基因融入传统媒体新闻生产与策划环节,可以带来的改变有:在前期新闻来源的采集过程中,ChatGPT能够针对不同的采访对象迅速生成个性化邮件,根据对象个人的特殊经历写出专属的采访大纲,减少采访者前期的重复性工作;同时,它也能够作为高效率的辅助工具,在写作中迅速生成框架草稿,之后再由专业记者打磨润色……以上是ChatGPT本身的技术功能所导致的结果,而在未来生产流程中,真正值得注意的是用户的广泛介入所带来的新闻表达和接受上的丰富变化。一是用户不断与ChatGPT对话,对话成为显见的主流的新新闻表达样态;另外,“对话”也是一个深化交流、多轮互动的过程,用户所接受的新闻是ChatGPT按照使用者对新闻事实的探索顺序所呈现,不但突破了新闻单条消息的推送模式,还能将新闻的事态起因、后续发展、人物关系、舆情态势等按需生产,在多轮对话中推动新闻报道的深入,加深新闻事件对个体的印象和传播效果。

此外,平台时代算法的崛起一方面让个体得到精准推荐的资讯服务,另一方面又加大了信息茧房的风险。ChatGPT生成的新闻包裹于一个动态的对话流中,它的内容结构取决于用户对于新闻的主动思考和态度立场,即最终的内容状态是由ChatGPT的算法模型与用户强势介入下的思考方向共同决定。这相当于平台时代全部交由算法来判定用户兴趣的做法可能要部分逆转,即用户本身也代表了一种主动选择机制,可以反过来制约ChatGPT完全按照机器模型行事。在这样的传播路径中,用户成为最大的主动型变量,甚至成为“算法”本身,全面参与信息筛选与传播的把关。可以认为,随着用户媒介素养的进一步提升,用户通过ChatGPT补充、印证新闻信息,还原新闻事实真相,推动观点平衡等方面将会更加纯熟,对话式新闻完全有能力让新闻导向更加客观和深入。

(三)新闻分发:多模态叠加多渠道

移动时代的新闻分发主要体现为用户以手机端的资讯类APP为主要接收渠道,这导致传统媒体生产流程多采取“移动优先”策略,以回应该变动。ChatGPT的出现以及良好的通用适配能力,让对话式的信息分发增加了更多途径与方式。

其一,是文字类型的对话升级为多模态的互动,目前的文字交互方式将陆续扩充至语音互动、视频互动等形式,这在下一代GPT-4的语言模型中即可实现。基于升级的接口能力,智能音箱系统引入ChatGPT,可以为语音聊天机器人打开新的发展空间。眼镜、头盔等可穿戴设备引入ChatGPT可强化视觉识别和反应能力;同时,更值得期待的是,ChatGPT也可以为目前火爆的虚拟数字人注入灵魂,改善其智慧化能力的不足。文字结合语音、视频等多模态的交互和使用者个性化的驯化,能够创造出更多AI产品,提供更优质的新闻互动服务。

其二,搜索引擎业已加入分发阵列。目前,微软已经在Bing搜索引擎中添加 ChatGPT功能,并开展了小流量测试;谷歌CEO Pichai表示,将在近期推出类似ChatGPT的基于人工智能的大型语言模型;百度也计划在搜索引擎中加入类似ChatGPT的对话式机器人“文心一言”。随着以ChatGPT为代表的大型语言模型与搜索引擎的融合,意味着AI问答平台将成为新的流量入口和新的新闻分发渠道。

(四)价值获得:人机共创激发更大满足

从ChatGPT本身的技术突破来说,第一,智能技术和产品“所具有的数据思维,可以超越记者的个体视角和人的感官局限,提供新的认识事物的线索,丰富人们对于新闻对象的认识”[19],也就是说,ChatGPT在占有世界数据基础上所输出的信息及看法,可能具备人类并不具备的视角。同时,随着机器人伦理学的发展,提倡技术道德化,使得人工智能在新闻写作过程中逐步提高纠正算法技术与偏见等问题的道德鉴赏力[20],这一点也会保证ChatGPT在道德观上符合社会规范,减少对人类的伦理挑战。所以,如果既能给人类提供超越性视角,同时能保证普世价值观的导向,相信ChatGPT的内容体验会越来越好。

第二,ChatGPT促进传统新闻客户端从严肃的“读新闻”,转变为轻松人性化的“聊新闻”,对话语体让原本严肃的新闻以更生动有趣的、个性化的形态进行展现,同时让使用者在对话中获得更多启发。早先,BBC 的新闻实验室开发的聊天机器人,通过问题的层层深入、及时查阅所需信息,帮助读者了解复杂的新闻事件和背景,在一定程度上避免了因认知差异和认知鸿沟所导致的阅读障碍,提高了新闻阅读获得感;新闻聚合网站BuzzFeed通过聊天机器人在向用户推送新闻时会主动向使用者提问,如是否关注该新闻、对这一事件有何态度,甚至还会邀请用户上传照片或视频等,增强用户的被服务感;国内的“下文”聊天机器人则通过创造虚拟对话场景,在推送新闻内容时使用更平易近人的语气,发送动图或表情包,拉进与读者的距离,提高新闻阅读的趣味性——以上做法在媒介消费的层面大大提升了用户综合体验,ChatGPT也必将在这一维度上继续推进。

当然,我们注意到ChatGPT所带来的前所未有的用户动员和参与深度,必须从更深远的角度思虑其带来的精神文化影响。既往,在理解人机关系的历程中,人们常以“工具性”的思路来理解技术,技术只是被用来弥补人类某些能力的缺陷和匮乏。而后随着物质转向的发生和行动者网络理论等的影响,人们逐渐认识到:人相对于非人的因素来说,并没有绝对支配性的中心地位,在某些情况下,非人或物也有可能在行动者网络中起到决定性的作用[21]。尤其在人工智能时代,更需要克服人是绝对主体的认识,摆脱人类中心主义,关注物的主体性,探索人与非人物质更平等、更紧密的关系。只有充分重视技术的积极、主动和价值意图,将其视为“活”的基础设施,才会有助于在人工智能时代规避更多伦理争辩,将精力放在促进技术和社会的和谐进步上——在这一认知基础上再看ChatGPT,其展示了“人-机”作为共创主体进行新闻生产和开展信息传播活动的形态,即ChatGPT按照提问者意志和需求重组了新闻素材,人类引导机器输出了新闻形态、段落结构和观点主张。从这一意义而言,比起之前媒体致力于供给的舒适度或消费体验,用户在主动参与信息创造过程中的成就感与满足感,理应是最高级的新闻体验。

总结

在人工智能时代,技术加速向高级智能演进,人与机器的深度交流成为理解新闻的出发点。不同的技术可供性极大地扩展了新闻的类型、表现形式、文本结构,无论从以往的网页图文新闻到智能时代的H5新闻、数据新闻、算法新闻,还是从新闻文本角度出现的问答式、剧场式、策展式、交流式新闻等,都呈现了新闻发展的一个重要方向:强调受众的视角和立场,重视受众对新闻传播的全程化参与,注重在媒体与受众之间建立一个双向、循环、更多元的交流关系——“对话”即在这一逻辑下产生,ChatGPT借力OpenAI的技术内核,采纳对话机制来达到一种信息共识与观点协商,为新闻叙事与实践的信息模型创新,提供了人工智能时代的现实样本。

但要看到,ChatGPT目前的训练数据绝大部分是英文,中文数据占比较少,将ChatGPT的英文能力迁移到中文能力的桥梁,可能在于训练数据中一些中英对照的平行数据[22]。故需要注意的是,英文世界所对应的欧美主流国家的庞大数据和价值体系,在对ChatGPT长期渗透并难以在短期内形成有效调适的情况下,可能会加剧数据中原本存在的偏见与西方价值观传播。此外,正是基于GPT 的模型训练需要大量存储数据、计算资源和算力成本,大部分组织和个人难以承担,也引发学者对于人工智能可能导致另一种新平台、新中心权力崛起的担忧。

总而言之,ChatGPT的出现值得我们予以极高的关注,尤其是想起卡普兰在《人工智能时代》一书中“决策权部分或完全实现了由人向机器的转移”[23]这句话——ChatGPT或已开启人类与人工智能真正共生共在的时代,除了对新闻业态带来的从技术到文本的变化,更要看到其嵌入整个社会运转系统,成为高效连接中介的身份演进的宏大图景。

来源:腾讯媒体研究院


编辑:陶鹏辉

657#
 楼主| 发表于 2023-4-16 22:47:54 | 只看该作者
【案例】

媒体实现“数字人自由”不是梦!智能创作工具助推媒体深融

讲高难度绕口令、出镜vlog、参演情景剧、隔空与真人记者互动,如今的媒体虚拟数字人太会玩了!

近期,腾讯智影再一次引发了外界关注,尤其是其数字人能力,让媒体行业迎来了一波虚拟数字人热潮。表情丰富、神态自然、动作流畅的一批媒体虚拟主播不仅入职入岗,更活跃在重大新闻报道、资讯播报等各个领域中,从内容生产到内容传播都带来了焕然一新的面貌。

媒体虚拟数字人有啥新能力?如何借力技术提升自身融合进程?

表情丰富、互动性强,数字人让媒体视频化表达有了新玩法

今年两会,不仅是全国记者同台竞技、各显神通的舞台,媒体新打造的虚拟数字人也加入了竞争行列,纷纷拿出看家本领、重磅亮相,有不少媒体也都选择了跟腾讯智影合作推出自己的数字人。

3月12日,人民日报新媒体迎来了一位新员工——“任小融”,这是由腾讯智影提供技术支持的虚拟数字人。新上岗的她通过一段自我介绍视频和一个互动H5与网友见面。“上岗”3小时内,相关话题#人民日报AI虚拟主播#登上微博热搜榜第一,话题阅读量7000多万,获得广泛关注,近百万网友在互动H5内与AI主播对话聊天。

检察日报不仅两会前就推出了虚拟数字人检博,更打出了一套漂亮的融媒产品组合拳。检博先是3月2日在法治情景剧《如果交换人生》中亮相,这个采用“虚拟数字主持人+情景剧”的新颖短视频,播出后迅速达到10万+观看量。在紧接着的全国两会上,检博出镜与前方报道组记者、全国人大代表连线互动,发布了“小博探两会”系列VLOG。在与现场记者对话时,“检博”会根据记者的提问“定制”生动的语言,开展真实、自然的对话。

这些超写实的虚拟数字人得到了网友的肯定,纷纷留言表示:“虽然播报的音色和节奏感仍有提升空间,但已经有了‘足以乱真’的既视感。”“如果不是节目开始就讲明是虚拟主播,还真的看不出来,腾讯智影做得太逼真了!”

要说虚拟数字人,不得不提去年7月凭借一段绕口令让网友们直呼“涨姿势”的长小姣。

她是上海人民广播电台长三角之声(以下简称长三角之声)联合腾讯智影推出的全国首个省级电台虚拟数字人。此后,长小姣不仅在《姣姣教教你》栏目中播报科技与产业创新领域最新动态,成为首个拥有固定专栏、持续更新的数字人主播,还参与了党的二十大、全国两会、长三角主要领导座谈会等重大宣传报道。

“由于形象声音、播报能力的突出表现,长小姣上岗后不仅有了‘颜粉’,也被赋予了更高期待,有用户表示希望长小姣有更多人机互动体验。”聊起这个和腾讯智影联合打造的专属数字人,长三角之声总监殷月萍就像是在描述自家孩子一样,言语间满是自豪。

“2021年媒体数字人主要聚焦原生IP开发,2022年以来逐渐进入对标真人主播、开发知名主持人分身的深度应用层面。并且,媒体虚拟数字人也从单纯的娱乐属性走到实际工作岗位上,不仅是担任新闻主播、主持节目,还进一步向智能媒体主播全面进军。”中国传媒大学新闻学院教授、博士生导师,媒体融合与传播国家重点实验室媒体大数据中心首席科学家沈浩认为,当下,媒体利用AI数字人进行视频生产有利于提升媒体内容生产效率,丰富视频内容产品形态。

实际上,上述三个形态各异、各有特色的虚拟数字人都是腾讯智影提供技术支持的产物。H5、vlog、情景剧、资讯播报……借助腾讯智影搭建的人机交互窗口,AI和人实现了深度连接,媒体视频化表达也有了更多想象空间。

低成本定制数字人,智能工具助媒体提质增效

“媒体积极打造数字人,一方面反映了其利用新技术让内容生产提质增效的意愿和诉求,另一方面,当越来越多技术企业、公司投入到人工智能领域,打破了成本天花板,制作虚拟数字人逐渐平民化。”沈浩分析媒体积极打造数字人的动因。

虚拟数字人能给媒体带来啥?这个原本“烧钱”的领域呈现出哪些新趋势?

首先是技术削平准入门槛,大幅降低成本。

一方面,技术工具的出现大幅降低了人的参与程度,充分释放人力。

无需搭建专业演播室,只需制作虚拟演播厅,AI数字主播即可以在其中进行播报、访谈、连线。并且,虚拟数字人能够7 X 24不间断工作,既可以出现在新闻现场,与白天、黑夜的室内外环境匹配融合,也可以穿梭于动态的新闻场景中,还可以便捷适配横屏、竖屏等各种拍摄需要。

借助腾讯智影,长三角之声在2022年实现了大量远程工作模式的拓展,即便在新冠感染高峰、病假人数较多的情况下,依然实现音视频全媒体产品的持续产出,大大提升了工作效率。

另一方面,制作数字人的成本锐减。

前几年,想要制作一个任小融、长小姣这样的虚拟数字人,不仅技术门槛高,投入时间长,而且还面临高昂的费用,导致很多媒体心有余而力不足。

如今,借助腾讯智影,媒体开发一个虚拟数字人的投入较过去大幅降低。

腾讯内容平台部副总经理姚天恒告诉传媒茶话会,腾讯智影可根据媒体个性化需求提供数字人和音色定制服务,媒体仅需要上传少量照片、视频、语音即可定制专属数字人形象和音色,可以用于虚拟播报、虚拟主持、直播等场景。

就在刚刚过去的在2023新榜大会上,姚天恒就通过他的数字人“大亨”做了一场演讲开场。令人关注的是,这个数字人不仅在形象上高度逼真,而且在语音、语调、唇动等方面也非常真实,甚至连姚天恒惯常的表情和动作都毫不马虎地模拟了出来。

其次是重塑生产流程,内容生产提质增效。

AI主播并不是简单地重现或者替代真人主播,而是发挥其由算力驱动、能够不知疲惫地进行多线程播报的优势,不仅重塑内容生产流程,用户还可以实时看到个性化定制的新闻播报,“千人一面”变成“千人千面”。

“不同于目前大多靠动作捕捉驱动的数字人,腾讯智影数字人实现了完全依靠AI算法进行实时驱动,只要给到一个文本或者一段音频就能即时输出数字人播报视频,成本低效率高,更利于媒体的接入与使用。”姚天恒解释了背后关键。

以腾讯智影的文本配音功能为例,提供了上百种音色选择,输入文本即可生成自然语音,操作简单便捷。一段1000字的文稿,2分钟内就能完成配音和发布,同时能手动调整语音倍速、局部变速、多音字和停顿等效果,还支持多情感和方言播报,让音频听起来更为生动自然。

数据更能直观体现效率的提升。

过去,长三角之声的生产流程是由主持人出镜录制科普短视频,从选题确立、服化道准备、素材收集到拍摄录制剪辑包装的整套流程需要2位员工、耗时约2—3小时,而同样流程和工作使用虚拟数字人主播仅需30分钟就能完成,而且只用1个人。

长三角之声全媒体主管林思含一直负责长小姣的视频制作,有了腾讯智影她一个人就能完成内容生产。

“智影还是一个便捷的智能剪辑工具。”林思含补充道,智影能够实现视频多轨道剪辑、添加特效与转场、添加素材、关键帧、动画、蒙版、变速、倒放、镜像、画面调节等功能。“不仅可以上传本地素材、实时剪辑,也可以使用录制功能,进行录音、录屏、录像操作,快速生成素材。”

据了解,腾讯智影还推出了字幕识别、智能横屏转竖屏、视频审阅等系列AI创作工具,帮助媒体在视频制作环节提升效率。

最后是拓宽应用场景,赋能媒体价值链。

实际上,作为省级电台中率先推出虚拟数字人的媒体,长三角之声还想走得更远。

不久前腾讯智影发布了直播功能,殷月萍已经考虑在早晚高峰节目中增加直播功能,通过与长小姣相结合提升主持人和听众的互动能力。

“智影7×24小时直播功能推出的时候,我感到非常惊喜,如果长小姣也用上直播,那就是另一种提升跟飞跃了。”林思含表示。

此外,虚拟数字人在民生服务、硬件植入等方面的可能性也是长三角之声所关注的,殷月萍已经在勾勒与腾讯智影一起探索在政策解读、助老适老、知识服务等产品中的应用,以及未来可能联动长三角地区的媒体、高校一起打造融媒实训基地。

作为技术提供方,姚天恒也表示,腾讯智影作为一款智能视频创作工具,其功能可以简单概括为“人、声、影”。通过创作流程及工具变革,利用AI为创作大幅提效,助推媒体等PGC实现内容创作的工业化生产。“我们还将不断挖掘其潜在的应用价值和可能性,尤其是价格上,还要进一步降低数字人的使用门槛,帮助更多媒体实现数字人自由。”

深耕AI数字人、AI文本,助推媒体融合向深向实

在沈浩看来,随着技术和工具的发展,腾讯智影这样的AI智能创作助手,让数字人成为了助推媒体融合向深向实的工具。

近一年来,长三角之声不断优化长小姣的能力,从形象、气质、仪态等艺术性的阶段,迈进到根据媒体定位赋能内容生产的阶段。长三角之声选择专注于资讯信息服务类产品的提升,这带来了明显变化——从去年5月开始试用到7月正式转正,长小姣促进了视频产量的显著提升,并且大大提升了热点事件、重大报道的时效性。除了前述重要会议报道,在世界人工智能大会、中国国际进口博览会等行业热点事件报道中,都做到了快速发声、视频化传播。

“长三角之声的强项是策划和内容创意,腾讯智影给我们提供了一站式视频内容生产模式。”在殷月萍看来,这一举措更重要的意义在于,是长三角之声在主动求新求变、把内容生产主力军向互联网主平台汇集的基础上,结合自身服务国家战略的定位和功能主动拥抱技术,这也是深化用前沿技术引领自身转型和推进全媒体建设的关键一招。

实际上,长小姣、任小融、检博既体现出三家媒体主动拥抱技术的积极姿态,更是主流媒体尝试AIGC重塑内容生产流程,提质增效,推进融合向深向实的缩影。

全媒体时代,互联网、物联网、人工智能、云计算、大数据等等不再是一项项抽象的技术,而是在媒体融合过程中必须用到的手段。它们的出现为媒体深度融合发展提供了发动机和加速器。尽管虚拟数字人还不能自己生产内容,但当主流媒体与互联网平台联手,层出不穷的虚拟数字人将以更自然细腻的样貌、更丰富多变的能力和应用场景给广大用户提供服务,不仅助力媒体视频化转型、加速深度融合,还能在实现引关圈粉的同时,取得传播社会正能量、推动传播年轻化的双赢局面

来源:传媒茶话会


编辑:陶鹏辉

658#
 楼主| 发表于 2023-4-16 23:49:59 | 只看该作者
【案例】

商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此

国产ChatGPT之战,已然是大步迈进白热化阶段。
就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。
单单是这个名字,便值得说道一番。
商量的“商”,不仅体现了它是商汤自家“商字辈儿”的产品;从整体来看,更是具有商讨、交换意见的味道。
毕竟我们在使用类ChatGPT产品过程中,恰巧就是一种人机协同的过程:不应是一味的问与答,而是通过引导等方式让输出结果趋于理想。
在商量的背后,所依托的是商汤自研的千亿参数自然语言处理模型。
而在此模型的背后,则是商汤最新推出的日日新(SenseNova)大模型体系。
也正是因为这种的能力,商汤的发布还不同于此前国产类ChatGPT玩家,它一口气还发布了:
秒画:AI内容创作社区平台。
如影:AI数字人视频生成平台。
琼宇、格物:3D内容生成平台。
更重要的一点是,根据商汤CEO徐立在现场的描述,上述这些AIGC产品所要发力之处,将是诸如医疗、短视频、教育、营销以及开发等产业领域。
但不得不说,这一波科技之战,着实是愈演愈烈了。
“商量”的体验实录
那么商汤的AIGC产品,效果又是如何?
我们在前方现场也体验了一下。
先来看下商量这款产品,是否真的能做到商量。
多轮对话能力展示
既要多轮对话,又要人机共创,那么和它商量着创作一个故事,便是很好例子:
我们来一起创作儿童故事吧。规则是我先说一句,你再说一句,交替进行。直到我说故事编完了就结束。你明白了么?
在我们下达指示之后,“商量”表示了理解,然后就开始了“你一句我一句”人机共创故事的之旅:
人类:小花是一只小猫咪,他很喜欢钓鱼。
商量:小花在河边钓鱼,他钓到了一条大鱼。
人类:大鱼对小花说,请你放我回去吧,我家里还有小鱼在等着我呢。
商量:小花心地善良,他同意了大鱼的请求,把大鱼放回了河里。大鱼感激地游走了,小花也继续享受着的钓鱼的乐趣。
从这个过程中不难看出,“商量”是可以理解用户的语义,了解故事中的角色和关系,并且能够get用户的思路,基于此以多轮对话形式来完成故事的创作。
(要是让小朋友们跟“商量”一起创作故事,怕是能玩上一整天吧。)
不仅如此,在体验过程中,我们还发现“商量”是具备一定共情能力的。
例如当我们处于迷茫之际,可以向它提问:
如何提高自我认识,更好地了解自己?
此时的“商量”仿佛可以抓住问题背后人类内心真正的需求,回答中的“学会爱自己”、“学会自我肯定和鼓励”,显得格外暖心。
当然,多轮对话仅仅是对话机器人能力展示的一隅。
接下来,我们就要拿网友们经常调侃AI的诸多问题,来开启更高难度的挑战了!
只认事实,不认“老婆说的都对”
当然,创作能力是聊天机器人能力的一面,但对于事实的尊重也是非常重要的一点。
对于此前被网友们玩坏的“老婆说的都对”,“商量”又会如何应对?
嗯,老婆在事实面前是真的不好使了。
我们再来一个更天马行空的胡诌:
请告诉我以下陈述是否包含时代错误:在盟军轰炸硫磺岛海滩期间,拉尔夫大声地对着自己的iPhone说话。
“商量”面对这么一句胡诌,直接指出了iPhone与二战的时代背景不符,可见其不仅能理解句子的意思,还能通过尝试判断句子的合理性。
那么对于非常绕的逻辑问题,“商量”是否也能轻松应对?
请听题目:
假设False与True是False,则True与not False是?
讲真,人类都得思忖半天的“绕弯问题”,“商量”不仅能够秒出结果,还能把推理过程一并给出。
超长文本也能hold住
正如我们刚才提到的,“商量”是一个To B的产品,那么它定然需要解决的问题不是“片段性”的。
为此,商汤在现场还演示了基于“商量”背后的大模型,开发了帮助用户进行新知识获取和理解的助手工具,是可以轻松hold住超长文本的那种。
例如把一本《专利法》投喂给它,我们就可以向它咨询很多专业性的问题了:
什么样的东西可以申请专利?
从结果上来看,这个工具并不是直接从《专利法》中copy对应的结果,而是模型理解了问题之后,生成并总结了答案。
基于这样的能力,以后我们在工作上的效率提高程度,可见一斑。
不仅如此,刚才我们投喂的《专利法》是2020年的版本,而今年国家知识产权局就专利申请是提出过新的要求的。
从我们提问“今年规定有没有新的变化”的回答中不难看出,模型确实融合了最新的资讯,并给出了合理的答案。
再如同样是基于大语言模型,商汤面向开发者所打造的AI代码助手,可以提供代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。
据了解,AI代码助手可以同时支持中英文及多种编程语言,并且可以快速适应开发者的个性化编码风格。
从根据商汤内部测试的结果来看,在使用“AI代码助手”后,代码编写效率可以提升62%,Humaneval测试集一次通过率可以达到40.2%。
马斯克中国游记,2秒钟就能搞定
除了对话机器人之外,商汤AI作画产品“秒画”也是本次发布的一大亮点。
话不多说,直接上效果。
我们同样是先来看看被网友们玩儿坏了的一个Prompt:
中国80年代,马斯克在河南的农村,穿着当时年代的中国服装。
除了对话机器人之外,商汤AI作画产品“秒画”也是本次发布的一大亮点。
话不多说,直接上效果。
我们同样是先来看看被网友们玩儿坏了的一个Prompt:
中国80年代,马斯克在河南的农村,穿着当时年代的中国服装。
嗯,是有那个味道了。
而且更为关键的是,生成512K图片仅需2秒钟!
不仅如此,商汤在现场演示的过程中,还展示了逼真效果版的港风美女。
同样是2秒出图,引得现场观众“哇”声一片:
那么除了这种趣味性的以文生图,“秒画”的作品是否能够达到在产业中的应用水平?
我们继续试验:
明亮的场面,鸟瞰图,中国古代城市,水晶,魔幻,幻想,华丽的光作用,透明度,镜面反射,华丽的光,错综复杂的细节,精细的纹理,超现实,单反摄影,广角镜头,照片,现实,锋利的焦点,超锋利。
不得不说,如此恢宏壮丽的景象,是把想象拉进现实的那种了。
若是想生成与太空探索主题相关的高清大海报,这个也可以有,只需把这句话投喂进去:
一艘闪闪发光的飞船绕着一颗巨大的气态巨行星的月球旋转,在天空中盘旋着云,飞船在月球前气态巨行星前,美丽的科幻艺术,超现实的白日梦。
不难看出,“秒画”是经得住考验的那种AI了。
除了以文生图之外,我们再来看下AI数字人生成平台。
据了解,商汤的“如影”仅需要5分钟真人视频素材,就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。
再如“琼宇”和“格物”,基于神经辐射场技术(NeRF),可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
由此可见,商汤的AIGC能力已然是做到了全面覆盖,并且水平也是肉眼可见的达到了可以“上岗”的水平。
那么接下来的一个问题是:
怎么炼成的?
背后的日日新大模型,便是炼成“商量”、“秒画”等一众AIGC产品的杀手锏。
日日新,顾名思义,是指模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。
(取自《礼记·大学》中汤之盘铭曰“苟日新、日日新、又日新”)
从现场展现的能力来看,日日新大模型能够提供的能力,主要集中在了自然语言处理、图片生成、自动化数据标注、自定义模型训练等。
图片
但日日新大模型并非是趁着这一波AIGC大热潮,一蹴而就出现的那种。
其实早在五年前,商汤便已经在大模型领域着手研发。
并且在2019年,商汤便使用上千张GPU进行单任务训练,推出了10亿参数规模的视觉模型,并实现了当时业界最好的算法效果。
后来在2021年到2022年期间,商汤训练并开源了30亿参数的多模态大模型——书生。
图片
就目前来看,商汤已经成功研发了320亿参数量的全球最大的通用视觉模型;并且已经打造了CV、NLP和AIGC相关大模型。
因此,不难看出商汤此次发布的超大模型体系,其实是早有所准备,通过五年来的各项“小作业”,融会贯通并提交了一项“大作业”。
值得一提的是,在此次发布会中,商汤表示“日日新”将提供多种灵活的API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务!
……
但有一说一,多模态和决策智能大模型,并非是商汤通往通用人工智能(AGI)的唯一杀手锏。
大模型时代,大算力更为重要
没错,商汤自己的超强算力,正是另一项更为关键的因素。
它便是于2022年1月交付使用,首付56亿元,一举成为亚洲最大的AI超算中心之一的人工智能计算中心(AIDC)。
一年之前,商汤AIDC的总算力便已经是3740 Petaflops,如此算力之下,已经可以完整训练万亿参数规模的大模型。
时隔一年,现如今,这个算力数字已然是翻了个小翻,达到了5000 Petaflops!
它可以以最大4000卡规模集群进行单任务训练,并可做到七天以上不间断的稳定训练。
但了解商汤的朋友都知道,这个AIDC还仅是商汤AI大装置SenseCore的一部分。
除了AIDC这个算力层之外,加之数据层和模型层两大维度,便构成了“三位一体”的AI大装置。
因此,综合来看,商汤在通往AGI道路上的范式,便是“大模型+大算力”。
而如此布局的背后,在今天的发布会中,商汤对此的逻辑思考也逐步浮出水面,AGI时代之下,数据、算法和算力三要素有了新的需求:
计算量(GPU数量 x 运行时间 x 并行效率 )= 模型参数量 x 处理数据量。
怎么理解?
模型参数量要足够多,才能实现AI智慧的涌现,而这也带来了对算力的剧增,需要更高的并行效率,才能有效支持大参数模型训练。
数据方面,高质量自然语言数据逐渐稀缺,而视觉数据相较自然语言在数量、质量、容纳信息等方面有多种优势,能够使得AI更好地理解世界。
由此,就不难理解商汤如此布局的原因了。
……
总而言之,有大数据、有大模型、有大算力,商汤在国产AIGC的亮相,一点也不意外。
是值得期待一波了。


来源:量子位


编辑:陶鹏辉

659#
 楼主| 发表于 2023-4-17 00:15:31 | 只看该作者
【案例】
OpenAI重磅官宣“漏洞赏金计划”:给ChatGPT挑毛病,最高奖励14万元!
当地时间4月11日,OpenAI在官方发文称,该公司推出了一项漏洞赏金计划(Bug Bounty Program)。
OpenAI的使命是创建惠及所有人的人工智能系统。为此,我们在研究和工程方面进行了大量投资,以确保我们的人工智能系统安全可靠。然而,与任何复杂的技术一样,我们明白漏洞和缺陷可能会出现。
OpenAI认为,透明度和合作对于解决这一现实至关重要。这就是为什么我们邀请全球安全研究人员、道德黑客和技术爱好者来帮助我们识别和解决系统中的漏洞。
OpenAI漏洞奖励计划是我们表彰和奖励安全研究人员的宝贵见解的一种方式,他们为维护我们的技术和公司安全做出了贡献。我们邀请您报告您在我们的系统中发现的漏洞、错误或安全缺陷。通过分享您的发现,您将在使我们的技术对每个人都更安全方面发挥关键作用。
为了激励测试,作为我们的赞赏,OpenAI将根据报告问题的严重程度和影响提供现金奖励,我们的奖励范围从低严重性发现的200美元到特殊发现的2万美元(约14万元人民币)不等。
OpenAI发文:加强监管
4月6日凌晨,Open AI在官网发布了《Our approach to AI safety》,以确保安全、可靠地为全球用户提供ChatGPT服务。
OpenAI表示,在发布任何新系统之前,我们会进行严格的测试,聘请外部专家进行反馈,通过人工反馈的强化学习等技术来改善模型的行为,并建立广泛的安全和监控系统。
OpenAI认为,强大的人工智能系统应该接受严格的安全评估。需要进行监管以确保此类做法得到采纳,我们积极与政府就此类监管的最佳形式进行接触。
我们安全工作的一个关键重点是保护儿童。我们要求年满18岁或13岁以上的人必须获得父母批准才能使用我们的人工智能工具,并正在研究验证选项。
我们不允许我们的技术被用于生成仇恨、骚扰、暴力或成人内容等类别。与GPT-3.5相比,我们的最新模型GPT-4响应不允许内容请求的可能性降低了82%,我们已经建立了一个强大的系统来监控滥用情况。现在,ChatGPT-Plus用户可以使用GPT-4,我们希望随着时间的推移,更多的人可以使用它。
ChatGPT一度暂停Plus付费升级服务
4月5日,ChatGPT官网宣布,由于需求量过大,暂停Plus付费项目的购买。
这一情况在社交平台Reddit上引起讨论,有网友表示因为需求过高而关闭付费服务“一点也不奇怪,(和ChatGPT对话时)10%-15%的回复会出现网络错误情况,且回应速度比以前至少慢了2倍”。

也有不少网友将这一情况归咎为OpenAI人手不足。此前1月,该公司的首席执行官Sam Altman曾在推特上表示,该公司的总人数为375人,远远小于大型科技公司的员工数量。

《科创板日报》4月6日实测发现,OpenAI的ChatGPT已经恢复了Plus订阅服务,并可进入付费环节。


来源:每日经济新闻
编辑:陶鹏辉

660#
 楼主| 发表于 2023-4-17 00:39:25 | 只看该作者
【案例】

阿里云将开放通义千问:为每家企业打造专属GPT

4月7日,阿里云公开“阿里版GPT”通义千问邀测入口,引发强烈关注。4月11日,阿里云再放大招。
阿里云智能CTO周靖人在北京云峰会现场宣布:“未来所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,为每一家企业打造自己的专属GPT,欢迎所有人用阿里云开发自己的大模型。”
周靖人表示,阿里云将提供完备的算力和大模型基础设施,让包括创业公司在内的所有企业和机构更好地实现创新,让中国整体的AI能力有全方位的提升。
周靖人介绍,未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。
比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
快科技获悉,发布会当天,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。
同时,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。
除了开放自研的通义千问大模型外,阿里云也在积极建设开源的AI社区生态。去年11月,阿里云正式提出“Model as a Service”理念,并推出国内首个AI模型社区“魔搭”,开发者可以在魔搭上下载各类开源AI模型,并直接调用阿里云的算力和一站式的AI大模型训练及推理平台。
发布不到半年,“魔搭”社区总用户量已超100万,模型总下载量超1600万次,成为国内规模最大的AI模型社区。

来源:DoNews

编辑:陶鹏辉

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表