传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
楼主: 刘海明
打印 上一主题 下一主题

人工智能与新闻业案例集锦

[复制链接]
581#
 楼主| 发表于 2023-2-1 16:20:08 | 只看该作者
【案例】

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代|附报告下载

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。在这个背景下,腾讯研究院正式发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》。报告从技术发展和产业生态、应用趋势、治理挑战等维度,对AIGC的发展趋势进行了深入思考。

本文为报告核心内容摘要(文末附下载):

AIGC技术和产业生态
迎来发展快车道

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。



图:AIGC技术累积融合

第一,基础的生成算法模型不断突破创新。比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。

第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。

第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。

未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。

在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。


第一层是基础层,以预训练模型为基础搭建的AIGC技术基础设施层。在国外,以OpenAI、Stability.ai为代表,通过受控API、开源等方式输出模型能力。

第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于Stable Diffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。

第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。

目前,从提供预训练的AI大模型的基础设施层公司到专注打造垂直领域内AIGC工具的中间层公司、再到直接面对消费者和终端用户提供产品和服务的应用层公司,美国围绕AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起;中国也有望凭借领先的AIGC技术赋能千行百业。

AIGC在消费互联网、产业互联网
和社会价值领域持续产生变革性影响

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。


图:AIGC应用现状概览(引用自红杉资本)

在消费互联网领域,AIGC牵引数字内容领域的全新变革。目前AIGC的爆发点主要是在内容消费领域,已经呈现百花齐放之势。AIGC生成的内容种类越来越丰富,而且内容质量也在显著提升,产业生态日益丰富。这其中有三个值得关注的趋势:

第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。

第二,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。比如,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长,根据6pen预测,未来五年10%-30%的图片内容由AI参与生成,有望创造超过600亿以上市场规模。也有国外商业咨询机构预测,2030年AIGC市场规模将达到1100亿美元。

第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。

在产业互联网领域,基于AIGC技术的合成数据(synthetic data)迎来重大发展,合成数据将牵引人工智能的未来。MIT科技评论将AI合成数据列为2022年10大突破性技术之一;Gartner也预测称,到2030年合成数据将彻底取代真实数据,成为训练AI的主要数据来源。


图:合成数据发展预测(来源:Gartner)

合成数据的用途是成为真实世界数据的廉价替代品,用来训练、测试、验证AI模型。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。这主要体现在以下四个方面:

第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI 2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。

第二,合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间。目前,合成数据正迅速向交通、金融、医疗、零售、工业等诸多产业领域拓展应用,帮助破解产业互联网应用中的数据难题。比如,腾讯自动驾驶团队研发的仿真系统TAD SIM可以自动生成各种交通场景数据,助力自动驾驶系统测试、开发。在医疗领域,美国国立卫生研究院和合成数据服务商合作,基于其COVID-19病人病历数据库,合成了不具有可识别性的替代数据,可供世界范围内的研究人员自由分享和使用。


图:腾讯自动驾驶数字孪生仿真平台

第三,正是由于合成数据对人工智能未来发展的巨大价值,合成数据正加速成为一个新产业赛道,科技大厂和创新企业纷纷抢先布局。目前,全球合成数据创业企业也已经达到100家,英伟达、亚马逊、微软等头部科技企业也在加速布局,涌现了合成数据即服务(SDaaS,synthetic data as a service)这一全新商业模式。

第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。

在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。


图:腾讯利用AIGC技术手段,助力敦煌古壁画修复

总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。

以可信AIGC
积极应对科技治理问题与挑战,

拥抱人工智能的下一个时代

发展总是与挑战并生,AIGC的发展也面临许多科技治理问题的挑战。目前,主要是知识产权、安全、伦理和环境四个方面的挑战。

首先,AIGC引发的新型版权侵权风险,已经成为整个行业发展所面临的紧迫问题。因版权争议,国外艺术作品平台ArtStation上的画师们掀起了抵制AIGC生成图像的活动。其次,安全问题始终存在于科技发展应用之中。在AIGC中,主要表现为信息内容安全、AIGC滥用引发诈骗等新型违法犯罪行为,以及AIGC的内生安全等。较为著名的案例是,诈骗团队利用AIGC换脸伪造埃隆·马斯克的视频,半年诈骗价值超过2亿人民币的数字货币。再次,算法歧视等伦理问题依然存在。比如,DALL·E 2具有显著的种族和性别刻板印象。最后是环境影响,AIGC模型训练消耗大量算力,碳排放量惊人。此前就有研究表明,单一机器学习模型训练所产生的碳排放,相当于普通汽车寿命期内碳排放量的5倍。


图:腾讯优图实验室推出FaceIn人脸防伪产品,能够自动检测精准识别视频、图像中是否应用人脸伪造技术

为了应对以上挑战,面向人工智能的下一个时代,人们需要更加负责任地、以人为本地发展应用AIGC技术,打造可信AIGC生态。面对AIGC技术应用可能带来的风险挑战,社会各界需要协同参与、共同应对,通过法律、伦理、技术等方面的多元措施支持构建可信AI生态。在立法方面,网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施,诸如禁止性要求、标识要求、安全评估等,亦适用于AIGC。接下来,需要着重从以下方面持续推进AIGC的政策和治理。

其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。

其二,研发应用AIGC技术的主体需要积极探索自律管理措施,例如,秉持不作恶、科技向善等目的,制定适宜的政策(消极要求和积极要求),采取控制和安全措施保障AIGC的安全可控应用,采取内容识别、内容溯源等技术确保AIGC的可靠来源。

其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethics by design)。

其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。

未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A

编辑:张铭麟

582#
 楼主| 发表于 2023-2-1 16:20:08 | 只看该作者
【案例】

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代|附报告下载

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。在这个背景下,腾讯研究院正式发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》。报告从技术发展和产业生态、应用趋势、治理挑战等维度,对AIGC的发展趋势进行了深入思考。

本文为报告核心内容摘要(文末附下载):

AIGC技术和产业生态
迎来发展快车道

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。



图:AIGC技术累积融合

第一,基础的生成算法模型不断突破创新。比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。

第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。

第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。

未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。

在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。


第一层是基础层,以预训练模型为基础搭建的AIGC技术基础设施层。在国外,以OpenAI、Stability.ai为代表,通过受控API、开源等方式输出模型能力。

第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于Stable Diffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。

第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。

目前,从提供预训练的AI大模型的基础设施层公司到专注打造垂直领域内AIGC工具的中间层公司、再到直接面对消费者和终端用户提供产品和服务的应用层公司,美国围绕AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起;中国也有望凭借领先的AIGC技术赋能千行百业。

AIGC在消费互联网、产业互联网
和社会价值领域持续产生变革性影响

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。


图:AIGC应用现状概览(引用自红杉资本)

在消费互联网领域,AIGC牵引数字内容领域的全新变革。目前AIGC的爆发点主要是在内容消费领域,已经呈现百花齐放之势。AIGC生成的内容种类越来越丰富,而且内容质量也在显著提升,产业生态日益丰富。这其中有三个值得关注的趋势:

第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。

第二,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。比如,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长,根据6pen预测,未来五年10%-30%的图片内容由AI参与生成,有望创造超过600亿以上市场规模。也有国外商业咨询机构预测,2030年AIGC市场规模将达到1100亿美元。

第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。

在产业互联网领域,基于AIGC技术的合成数据(synthetic data)迎来重大发展,合成数据将牵引人工智能的未来。MIT科技评论将AI合成数据列为2022年10大突破性技术之一;Gartner也预测称,到2030年合成数据将彻底取代真实数据,成为训练AI的主要数据来源。


图:合成数据发展预测(来源:Gartner)

合成数据的用途是成为真实世界数据的廉价替代品,用来训练、测试、验证AI模型。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。这主要体现在以下四个方面:

第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI 2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。

第二,合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间。目前,合成数据正迅速向交通、金融、医疗、零售、工业等诸多产业领域拓展应用,帮助破解产业互联网应用中的数据难题。比如,腾讯自动驾驶团队研发的仿真系统TAD SIM可以自动生成各种交通场景数据,助力自动驾驶系统测试、开发。在医疗领域,美国国立卫生研究院和合成数据服务商合作,基于其COVID-19病人病历数据库,合成了不具有可识别性的替代数据,可供世界范围内的研究人员自由分享和使用。


图:腾讯自动驾驶数字孪生仿真平台

第三,正是由于合成数据对人工智能未来发展的巨大价值,合成数据正加速成为一个新产业赛道,科技大厂和创新企业纷纷抢先布局。目前,全球合成数据创业企业也已经达到100家,英伟达、亚马逊、微软等头部科技企业也在加速布局,涌现了合成数据即服务(SDaaS,synthetic data as a service)这一全新商业模式。

第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。

在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。


图:腾讯利用AIGC技术手段,助力敦煌古壁画修复

总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。

以可信AIGC
积极应对科技治理问题与挑战,

拥抱人工智能的下一个时代

发展总是与挑战并生,AIGC的发展也面临许多科技治理问题的挑战。目前,主要是知识产权、安全、伦理和环境四个方面的挑战。

首先,AIGC引发的新型版权侵权风险,已经成为整个行业发展所面临的紧迫问题。因版权争议,国外艺术作品平台ArtStation上的画师们掀起了抵制AIGC生成图像的活动。其次,安全问题始终存在于科技发展应用之中。在AIGC中,主要表现为信息内容安全、AIGC滥用引发诈骗等新型违法犯罪行为,以及AIGC的内生安全等。较为著名的案例是,诈骗团队利用AIGC换脸伪造埃隆·马斯克的视频,半年诈骗价值超过2亿人民币的数字货币。再次,算法歧视等伦理问题依然存在。比如,DALL·E 2具有显著的种族和性别刻板印象。最后是环境影响,AIGC模型训练消耗大量算力,碳排放量惊人。此前就有研究表明,单一机器学习模型训练所产生的碳排放,相当于普通汽车寿命期内碳排放量的5倍。


图:腾讯优图实验室推出FaceIn人脸防伪产品,能够自动检测精准识别视频、图像中是否应用人脸伪造技术

为了应对以上挑战,面向人工智能的下一个时代,人们需要更加负责任地、以人为本地发展应用AIGC技术,打造可信AIGC生态。面对AIGC技术应用可能带来的风险挑战,社会各界需要协同参与、共同应对,通过法律、伦理、技术等方面的多元措施支持构建可信AI生态。在立法方面,网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施,诸如禁止性要求、标识要求、安全评估等,亦适用于AIGC。接下来,需要着重从以下方面持续推进AIGC的政策和治理。

其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。

其二,研发应用AIGC技术的主体需要积极探索自律管理措施,例如,秉持不作恶、科技向善等目的,制定适宜的政策(消极要求和积极要求),采取控制和安全措施保障AIGC的安全可控应用,采取内容识别、内容溯源等技术确保AIGC的可靠来源。

其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethics by design)。

其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。

未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A

编辑:张铭麟

583#
 楼主| 发表于 2023-2-1 16:20:08 | 只看该作者
【案例】

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代|附报告下载

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。在这个背景下,腾讯研究院正式发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》。报告从技术发展和产业生态、应用趋势、治理挑战等维度,对AIGC的发展趋势进行了深入思考。

本文为报告核心内容摘要(文末附下载):

AIGC技术和产业生态
迎来发展快车道

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。



图:AIGC技术累积融合

第一,基础的生成算法模型不断突破创新。比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。

第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。

第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。

未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。

在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。


第一层是基础层,以预训练模型为基础搭建的AIGC技术基础设施层。在国外,以OpenAI、Stability.ai为代表,通过受控API、开源等方式输出模型能力。

第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于Stable Diffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。

第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。

目前,从提供预训练的AI大模型的基础设施层公司到专注打造垂直领域内AIGC工具的中间层公司、再到直接面对消费者和终端用户提供产品和服务的应用层公司,美国围绕AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起;中国也有望凭借领先的AIGC技术赋能千行百业。

AIGC在消费互联网、产业互联网
和社会价值领域持续产生变革性影响

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。


图:AIGC应用现状概览(引用自红杉资本)

在消费互联网领域,AIGC牵引数字内容领域的全新变革。目前AIGC的爆发点主要是在内容消费领域,已经呈现百花齐放之势。AIGC生成的内容种类越来越丰富,而且内容质量也在显著提升,产业生态日益丰富。这其中有三个值得关注的趋势:

第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。

第二,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。比如,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长,根据6pen预测,未来五年10%-30%的图片内容由AI参与生成,有望创造超过600亿以上市场规模。也有国外商业咨询机构预测,2030年AIGC市场规模将达到1100亿美元。

第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。

在产业互联网领域,基于AIGC技术的合成数据(synthetic data)迎来重大发展,合成数据将牵引人工智能的未来。MIT科技评论将AI合成数据列为2022年10大突破性技术之一;Gartner也预测称,到2030年合成数据将彻底取代真实数据,成为训练AI的主要数据来源。


图:合成数据发展预测(来源:Gartner)

合成数据的用途是成为真实世界数据的廉价替代品,用来训练、测试、验证AI模型。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。这主要体现在以下四个方面:

第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI 2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。

第二,合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间。目前,合成数据正迅速向交通、金融、医疗、零售、工业等诸多产业领域拓展应用,帮助破解产业互联网应用中的数据难题。比如,腾讯自动驾驶团队研发的仿真系统TAD SIM可以自动生成各种交通场景数据,助力自动驾驶系统测试、开发。在医疗领域,美国国立卫生研究院和合成数据服务商合作,基于其COVID-19病人病历数据库,合成了不具有可识别性的替代数据,可供世界范围内的研究人员自由分享和使用。


图:腾讯自动驾驶数字孪生仿真平台

第三,正是由于合成数据对人工智能未来发展的巨大价值,合成数据正加速成为一个新产业赛道,科技大厂和创新企业纷纷抢先布局。目前,全球合成数据创业企业也已经达到100家,英伟达、亚马逊、微软等头部科技企业也在加速布局,涌现了合成数据即服务(SDaaS,synthetic data as a service)这一全新商业模式。

第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。

在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。


图:腾讯利用AIGC技术手段,助力敦煌古壁画修复

总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。

以可信AIGC
积极应对科技治理问题与挑战,

拥抱人工智能的下一个时代

发展总是与挑战并生,AIGC的发展也面临许多科技治理问题的挑战。目前,主要是知识产权、安全、伦理和环境四个方面的挑战。

首先,AIGC引发的新型版权侵权风险,已经成为整个行业发展所面临的紧迫问题。因版权争议,国外艺术作品平台ArtStation上的画师们掀起了抵制AIGC生成图像的活动。其次,安全问题始终存在于科技发展应用之中。在AIGC中,主要表现为信息内容安全、AIGC滥用引发诈骗等新型违法犯罪行为,以及AIGC的内生安全等。较为著名的案例是,诈骗团队利用AIGC换脸伪造埃隆·马斯克的视频,半年诈骗价值超过2亿人民币的数字货币。再次,算法歧视等伦理问题依然存在。比如,DALL·E 2具有显著的种族和性别刻板印象。最后是环境影响,AIGC模型训练消耗大量算力,碳排放量惊人。此前就有研究表明,单一机器学习模型训练所产生的碳排放,相当于普通汽车寿命期内碳排放量的5倍。


图:腾讯优图实验室推出FaceIn人脸防伪产品,能够自动检测精准识别视频、图像中是否应用人脸伪造技术

为了应对以上挑战,面向人工智能的下一个时代,人们需要更加负责任地、以人为本地发展应用AIGC技术,打造可信AIGC生态。面对AIGC技术应用可能带来的风险挑战,社会各界需要协同参与、共同应对,通过法律、伦理、技术等方面的多元措施支持构建可信AI生态。在立法方面,网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施,诸如禁止性要求、标识要求、安全评估等,亦适用于AIGC。接下来,需要着重从以下方面持续推进AIGC的政策和治理。

其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。

其二,研发应用AIGC技术的主体需要积极探索自律管理措施,例如,秉持不作恶、科技向善等目的,制定适宜的政策(消极要求和积极要求),采取控制和安全措施保障AIGC的安全可控应用,采取内容识别、内容溯源等技术确保AIGC的可靠来源。

其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethics by design)。

其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。

未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A

编辑:张铭麟

584#
 楼主| 发表于 2023-2-1 16:20:08 | 只看该作者
【案例】

腾讯发布 AIGC 发展趋势报告:迎接人工智能的下一个时代|附报告下载

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。

就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。在这个背景下,腾讯研究院正式发布《AIGC发展趋势报告2023:迎接人工智能的下一个时代》。报告从技术发展和产业生态、应用趋势、治理挑战等维度,对AIGC的发展趋势进行了深入思考。

本文为报告核心内容摘要(文末附下载):

AIGC技术和产业生态
迎来发展快车道

AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。



图:AIGC技术累积融合

第一,基础的生成算法模型不断突破创新。比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。

第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。

第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。

未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。

在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。


第一层是基础层,以预训练模型为基础搭建的AIGC技术基础设施层。在国外,以OpenAI、Stability.ai为代表,通过受控API、开源等方式输出模型能力。

第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于Stable Diffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。

第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。

目前,从提供预训练的AI大模型的基础设施层公司到专注打造垂直领域内AIGC工具的中间层公司、再到直接面对消费者和终端用户提供产品和服务的应用层公司,美国围绕AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起;中国也有望凭借领先的AIGC技术赋能千行百业。

AIGC在消费互联网、产业互联网
和社会价值领域持续产生变革性影响

AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。


图:AIGC应用现状概览(引用自红杉资本)

在消费互联网领域,AIGC牵引数字内容领域的全新变革。目前AIGC的爆发点主要是在内容消费领域,已经呈现百花齐放之势。AIGC生成的内容种类越来越丰富,而且内容质量也在显著提升,产业生态日益丰富。这其中有三个值得关注的趋势:

第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。

第二,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。比如,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长,根据6pen预测,未来五年10%-30%的图片内容由AI参与生成,有望创造超过600亿以上市场规模。也有国外商业咨询机构预测,2030年AIGC市场规模将达到1100亿美元。

第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。

在产业互联网领域,基于AIGC技术的合成数据(synthetic data)迎来重大发展,合成数据将牵引人工智能的未来。MIT科技评论将AI合成数据列为2022年10大突破性技术之一;Gartner也预测称,到2030年合成数据将彻底取代真实数据,成为训练AI的主要数据来源。


图:合成数据发展预测(来源:Gartner)

合成数据的用途是成为真实世界数据的廉价替代品,用来训练、测试、验证AI模型。AIGC技术的持续创新,让合成数据迎来新的发展契机,开始迸发出更大的产业发展和商业应用活力。这主要体现在以下四个方面:

第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI 2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。

第二,合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间。目前,合成数据正迅速向交通、金融、医疗、零售、工业等诸多产业领域拓展应用,帮助破解产业互联网应用中的数据难题。比如,腾讯自动驾驶团队研发的仿真系统TAD SIM可以自动生成各种交通场景数据,助力自动驾驶系统测试、开发。在医疗领域,美国国立卫生研究院和合成数据服务商合作,基于其COVID-19病人病历数据库,合成了不具有可识别性的替代数据,可供世界范围内的研究人员自由分享和使用。


图:腾讯自动驾驶数字孪生仿真平台

第三,正是由于合成数据对人工智能未来发展的巨大价值,合成数据正加速成为一个新产业赛道,科技大厂和创新企业纷纷抢先布局。目前,全球合成数据创业企业也已经达到100家,英伟达、亚马逊、微软等头部科技企业也在加速布局,涌现了合成数据即服务(SDaaS,synthetic data as a service)这一全新商业模式。

第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。

在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。


图:腾讯利用AIGC技术手段,助力敦煌古壁画修复

总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。

以可信AIGC
积极应对科技治理问题与挑战,

拥抱人工智能的下一个时代

发展总是与挑战并生,AIGC的发展也面临许多科技治理问题的挑战。目前,主要是知识产权、安全、伦理和环境四个方面的挑战。

首先,AIGC引发的新型版权侵权风险,已经成为整个行业发展所面临的紧迫问题。因版权争议,国外艺术作品平台ArtStation上的画师们掀起了抵制AIGC生成图像的活动。其次,安全问题始终存在于科技发展应用之中。在AIGC中,主要表现为信息内容安全、AIGC滥用引发诈骗等新型违法犯罪行为,以及AIGC的内生安全等。较为著名的案例是,诈骗团队利用AIGC换脸伪造埃隆·马斯克的视频,半年诈骗价值超过2亿人民币的数字货币。再次,算法歧视等伦理问题依然存在。比如,DALL·E 2具有显著的种族和性别刻板印象。最后是环境影响,AIGC模型训练消耗大量算力,碳排放量惊人。此前就有研究表明,单一机器学习模型训练所产生的碳排放,相当于普通汽车寿命期内碳排放量的5倍。


图:腾讯优图实验室推出FaceIn人脸防伪产品,能够自动检测精准识别视频、图像中是否应用人脸伪造技术

为了应对以上挑战,面向人工智能的下一个时代,人们需要更加负责任地、以人为本地发展应用AIGC技术,打造可信AIGC生态。面对AIGC技术应用可能带来的风险挑战,社会各界需要协同参与、共同应对,通过法律、伦理、技术等方面的多元措施支持构建可信AI生态。在立法方面,网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施,诸如禁止性要求、标识要求、安全评估等,亦适用于AIGC。接下来,需要着重从以下方面持续推进AIGC的政策和治理。

其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。

其二,研发应用AIGC技术的主体需要积极探索自律管理措施,例如,秉持不作恶、科技向善等目的,制定适宜的政策(消极要求和积极要求),采取控制和安全措施保障AIGC的安全可控应用,采取内容识别、内容溯源等技术确保AIGC的可靠来源。

其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethics by design)。

其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。

未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。

来源:腾讯研究院
链接:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A

编辑:张铭麟

585#
 楼主| 发表于 2023-2-3 21:47:41 | 只看该作者
【案例】


ChatGPT,背后的核心是什么?

2022年12月份的时候,ChatGPT还只是个被人各种撩的聊天工具。但进入2023年后,已经向着效率工具迈进了。

微软宣布正和ChatGPT开发团队OpenAI进行洽谈,投资百亿美元,并计划把这个工具整合到云服务、搜索引擎、甚至office中。海外高校、学术机构,也兴起了关于用ChatGPT写论文是否合规的大讨论;咨询公司也开始担忧是否会被抢饭碗。

毫无疑问,ChatGPT的应用热情,已经被点燃;应用场景也不断拓展。但ChatGPT并不是一蹴而就,以更广阔的的视野来看,这背后是AIGC“智慧涌现”的大浪潮。那么,AIGC的发展节点有哪些?企业竞争靠什么?

AIGC是如何一步步突破的?

AI懂创作、会画画,可以说是人工智能的一个“跨越式”提升。虽然人工智能在生活中不断普及,比如我们习惯了机器代替人去搬运重物、制造精密的产品、完成复杂的计算等等。但是,如果人工智能更接近人,那就必须具备人类“创作”的能力。这就是AIGC的意义。

AI能力的提升,并不是一蹴而就,而大部分则经历了“模型突破-大幅提升-规模化生产-遇到障碍-再模型突破-大幅提升”的循环发展。而要实现落地、走进人类生活,则必须具备“规模化生产”的能力,在资源消耗、学习门槛等方面大幅降低到平民化。

比如以AI画画为例,则经历了三个关键节点:

第一个节点,早期突破:2014年,对抗生成网络(GAN)诞生,真正“教会”AI自己画画。

GAN包含两个模型,一个是生成网络G、一个是判别网络D。G负责把接收到的随机噪声生成图片,D则要判断这张图是G画的、还是现实世界就存在的。G、D互相博弈,能力也不断提升,而当D不再能判断出G生成的图片时,训练就达到了平衡。

GAN的开创性在于,精巧地设计了一种“自监督学习”方式,跳出了以往监督学习需要大量标签数据的应用困境,可以广泛应用于图像生成、风格迁移、AI艺术和黑白老照片上色修复。

但其缺陷也正来源于这一开创性:由于需要同步训练两个模型,GAN的稳定性较差,容易出现模式崩溃。以及另一个有趣的现象“海奥维提卡现象”(the helvetica scenario):如果G模型发现了一个能够骗过D模型的bug,它就会开始偷懒,一直用这张图片来欺骗D,导致整个平衡的无效。

模型也会躺平,这鸡贼的特性,真是有人的风格。

第二个节点,大幅提升:2020年,一篇关于扩散模型(Diffusion Model)的学术论文,大幅提升AI的画画水平。

扩散模型的原理是“先增噪后降噪”。首先给现有的图像逐步施加高斯噪声,直到图像被完全破坏,然后再根据给定的高斯噪声,逆向逐步还原出原图。当模型训练完成后,输入一个随机的高斯噪声,便能“无中生有”出一张图像了。

这样的设计大大降低了模型训练难度,突破了GAN模型的局限,在逼真的基础上兼具多样性,也就能够更快、更稳定的生成图片。

扩散模型在AI业界的“起飞”源于2021年1月,Open AI基于此开发出DALL·E文字生成图片模型,能够生成接近真实生活但并不真实存在的图片,让AI业界震了三震。但由于在像素空间进行了大量计算,这一模型仍存在进程缓慢、内存消耗大的缺陷。

第三个节点,批量生产:2022年夏天诞生的Stable Diffusion,让高大上的学术理论变得“接地气”。

去年8月,Stability AI将扩散过程放到更低维度的潜空间(Latent Diffusion),从而开发出了Stable Diffusion模型。这个模型带来的提升,在于资源消耗大幅降低,消费级显卡就可以驱动的,可以操作也更为方便,普通人也可以体会到人工智能惊艳的创作能力。而且开发团队还把所有代码、模型和权重参数库都进行了开源,践行了Geek的共享精神、去中心化主义。

门槛降低、效果提升,因此,大受欢迎。发布10天后,活跃数据达到了每天1700万张,如果都用A4纸打印出来叠一起,相当于一座52层高的大楼。

共享,也是Stability AI的另一特色。在开源社区中,除了更小的内存和更快的速度,Stable Diffusion收获了更完善的指南与教程、共享提示词、新UI,也依靠集体的智慧,走进了Photoshop、Figma等经典软件,汇入创作者们的既有工作流中。可谓是,依靠群众、回馈群众。

从技术实现突破、到技术提升、再到规模化降低门槛,AI创作能力也不断提升。2022年10月,美国一名男子用AI绘画工具Midjourney,生成了一幅名为《太空歌剧院》的作品,并获得了第一名。这引起了一波不小的争论,也终于形成了一条新赛道。于是,2022年以AI绘画为代表的各种生成式AI工具,如雨后春笋般疯狂冒尖,比如盗梦师、意间AI、6pen、novelAI等等。

而在文本AI领域也是如此。如今大火的ChatGPT则是基于GPT3.5模型,已经迭代了4次。而对话一次的平均成本为0.01-0.2美元,也就是六毛到一块钱人民币,成本依然需要不断降低。但整体而言,无论画画、还是聊天,AI已经体现出智慧涌现。

如何成为浪潮宠儿?

Stability AI的创始人Emad认为,图像才是杀手级应用。

图像模型可以迅速创造,并引导人们迅速消费,同时又能以较低成本快速整合到不同领域,从而快速普及,掀起浪潮。而事实上,确实许多创业者涌入了这些领域。AIGC成为了币圈之后的投资新焦点。在 GPT-3 发布的两年内,风投资本对 AIGC 的投资增长了四倍,在 2022 年更是达到了 21 亿美元。


公司增多,投资增多,但并不是每家企业都能活得很好。比如2022年底,仅创立4个月的AI绘画公司StockAI就停止了运营。公司CEO表示,主要是因为商业化模式不成熟,目前的付费用户群体无法覆盖高昂的运营成本。虽然他也表明会在今年1月份推出全新的平台,但从透露的信息来看,新平台已不会有需要大量算力的AI图片生成功能了。

那么,什么样的企业,才是这波浪潮的“宠儿”?

首先,无疑是掌握核心前沿技术的行业引领者。全球TOP3的人工智能研究机构,都在各出奇招、争夺AIGC主导地位。

OpenAI是文字生成领域的领航员。不光吸引了“生成对抗网络之父”Ian Goodfellow加盟,还早早获得了微软的10亿美元投资。从GPT到GPT3.5,OpenAI不断迭代,也不断带给行业惊喜。这一次的ChatGPT更加获得了微软的认可。而通过开放GPT-3受控API的模式,OpenAI也将赋能更多公司和创业者。

DeepMind是通用型AI的探路人。2016年,AlphaGo击败人类围棋的最高代表韩国棋手李世石,Go背后正是谷歌旗下的DeepMind。但DeepMind的目标并不是下棋,而是通用型AI,比如能预测蛋白质结构的AlphaFold、能解决复杂数学计算的AlphaTensor等等。但这些AI始终面临着一个瓶颈,即无法像人类一样进行“无中生有”的创作。

这两年,DeepMind终于向通用型AI又推近了一步。在对话机器人Sparrow、剧本创作机器人Dramatron等背后的语言大模型中找到灵感,构建了会聊天、会干活、会玩游戏的Gato。

Meta在加速AI的商业化落地。重组调整AI部门,将其分布式地下放到各实际业务中,而FAIR被并入元宇宙核心部门Reality Labs Research,成为新场景探索者的一员。

也许同行相轻,Meta首席人工智能科学家Yann LeCun对ChatGPT的评价并不高,他认为从底层技术上看,ChatGPT并不是什么创新性、革命性的发明,除了谷歌和Meta,至少有六家初创公司拥有类似的技术。

当被问及Meta的AI愿景时,LeCun为FAIR画下了“生成艺术”的大饼。他提出,Facebook上有1200万商铺在投放广告,其中多是没有什么资源定制广告的夫妻店,Meta将通过能够自动生成宣传资料的AI帮助他们做更好的推广。

其次,另一类宠儿,则是押对应用场景的企业们,在“绘画”之外吸纳了不少资本支持与人才投入。

在所有内容生成式AI中,输出文字和音乐的已经先一步找到了财富密码。最早出现的AI生成文字在遍历了写新闻稿、写诗、写小剧本等颇受关注的应用方式后,终于在营销场景找到了能够稳定变现的商业模式,成为写作辅助的效率工具,帮助从业者写邮件、文案、甚至策划。专注于音乐的LifeScore,则让人工智能学会了即时编曲,按照场景、长度的需要,组织艺术家同事人工创作、演奏的音乐素材,在人类的创作流程中找到了自己的位置。

能够互动的聊天机器人,则在客服和游戏这两个相去甚远的行业分别“打工”。区别于当下只会提供预设问题解答,有时还会答非所问的“智能客服”,真正的AI需要结合用户的行为和上下文来理解人类的真正意图。在游戏领域,AI则被用来协助人类,高效地创造内容丰富、体验良好的游戏内容,从而延长用户的游戏时间。

显然,宠儿是少的。而经历了过去一年多“科技股大回落”后,投资者们也谨慎一些了,当下的AIGC虽然很好,但等大模型出来也许更香。

大模型,也许是企业比拼的护城河

模型是人工智能的灵魂,本质上它是一套计算公式和数学模型。“参数”可以看做是模型里的一个个公式,这意味着,参数量越大,模型越复杂,做出来的预测就越准确。

小模型就像“偏科的机器”,只学习针对特定应用场景的有限数据,“举一反三”能力不足,一些智能产品被用户调侃为“人工智障”的情况时有发生。

大模型就是参数量极大的模型,目前业界主流的AIGC模型都是千亿级、万亿级参数量的水平。通过学习各行各业各类数据,除了能给出相较于小模型更准确的预测结果之外,它也展现出了惊人的泛化能力、迁移能力,产出内容质量更高、更智能,这也是当前AIGC工具让人眼前一亮的原因。

而大模型的快速发展,对行业发展起到了明显的推动作用。例如ChatGPT是基于GPT-3模型进行优化所产生的,引领AI绘画发展的DALL·E 2也离不开GPT-3的贡献。类似的还有Deepmind的Chinchilla、百度的文心大模型等等。

大模型,很大概率是行业淘汰与否的判断要素。

首先,训练数据量大,OpenAI为了让GPT-3的表现更接近人类,用了45TB的数据量、近 1 万亿个单词来训练它,大概是1351万本牛津词典。


GPT-3 训练数据集一览

这就带来了两个问题:巨大的算力需求与资金消耗。训练和运行模型都需要庞大的算力,有研究估测,训练 1750 亿参数语言大模型 GPT-3,需要有上万个 CPU/GPU 24 小时不间输入数据,所需能耗相当于开车往返地球和月球,且一次运算就要花费450万美元。

国内也不例外。目前国内自研的大模型包括百度的文心大模型、阿里的M6大模型、腾讯的混元大模型,针对中文语境,国内厂商的表现要比国外大厂要好得多。而且国内的大模型发展速度也很惊人。

采用稀疏MoE结构的M6大模型,2021年3月仅1000亿参数,3个月后就达到了万亿级,又过了五个月模型参数达到了十万亿级,成为全球最大的AI预训练模型。混元模型也是万亿级别,成本大幅降低,最快用256张卡,1天内就能训练完成。而采用稠密结构(可以粗糙理解是和稀疏相比,密度更大)的文心大模型,2021年,参数规模达到2600亿。2022年,百度又先后发布了数十个大模型,其中有11个行业大模型。

这样高的研发门槛,注定目前主流的大模型多由大企业、或是背靠大企业的研究机构掌握,中小企业只能望而却步。因此,大模型,也就成为企业的“护城河”。

但进行大模型的研发只是“成功第一步”,还有三个维度的比拼,也非常重要。

一是数据资源。有研究表明,到2026年就没有更多高质量的数据可以训练AI了。此外,基于现实生活中已有的数据来训练模型只能解决一些已知问题,对于一些我们还没有发现的、潜在的、未知的问题,现在的模型未必能解决。因此有一些研究人员提出了合成数据的概念,即通过计算机程序人工合成的数据,一方面补充高质量的训练数据,另一方面填补一些极端或者边缘的案例,增加模型的可靠性。

二是绿色发展。虽然模型越大效果越好,但无限“大”下去并不经济,对自然资源消耗、数据资源都带来巨大压力。而过高的资源消耗,也不利于平民化普及。

三是应用场景。商业和纯理论研究不同,不能拿着技术的锤子,瞎找钉子,而是要结合应用来发展技术。而国内厂商要想拿出Stable Diffusion、ChatGPT这样的杀手级应用,还需要更多的思考和努力:

跳出“跑分”怪圈,找到应用场景,进行模型“瘦身”,甚至,将模型开源、形成生态,利用群众的智慧、为群众服务。

尾声

随着微软对ChatGPT的关注,产业、投资圈都热了起来,美股BuzzFeed因为要采用ChatGPT技术就实现了两天涨三倍的壮举;H股、A股也迎风而动,不少上市公司也表态具备技术积累。

躁动当然是好事儿,科技创新,就是要令人心潮澎湃。我国广阔的产业,是应用开花的土壤。但与此同时,国内的AIGC也存在着隐忧,比如高算力的芯片,如何造出来?

另一方面,科技创新,也要牢记Gartner曲线揭示的规律:萌发期→泡沫期→泡沫破裂期→稳步发展期→稳定产出期。只有躁动,没有笃定、没有低谷时的忍耐,也绝不可能成功的。

适度的泡沫,成为驱动力;过度的泡沫,也许会劣币驱逐良币。但至少目前,我们和海外相比,几乎在同一起跑线,值得充满热情的期待。

来源:人工智能学家
链接:https://mp.weixin.qq.com/s/a1rSQ2MgA7qKL9205YZbnQ

编辑:张铭麟

586#
 楼主| 发表于 2023-2-8 13:51:44 | 只看该作者
【案例】

ChatGPT:“有限盈利”的公司+有趣的“人”

近日,来自OpenAI公司的新型AI聊天机器人ChatGPT,引发全球关注。去年12月初我试用时,机器的回答出乎我的意料,还真像和一个社会经验丰富的成人在对话。回答全面、周到,有的问题答得可以说滴水不漏。


ChatGPT推出短短几天,就席卷了互联网,用户突破百万。如今刚两个月,用户已超1亿,成为历史上增长最快的消费者应用程序。而同样达到1亿用户,TikTok用了约9个月,Instagram用了30个月,Uber更是用了70个月。
可以说,ChatGPT俘获了全世界的想象力,OpenAI也确实不是一家寻常的公司。
它是2015年由一群科技领袖,包括奥特曼( Sam Altman)、和埃隆·马斯克(Elon Musk)、彼得·泰尔(Peter Thiel,《从0到1》作者)、里德·霍夫曼(Reid Hoffman,Linkedin创始人)等人创办的,目标是确保人工智能不会消灭人类。
起初它是一个非营利性的研究实验室,就像美国其他著名的研究机构如Broad Institute、SETI。2018年马斯克宣布退出。2019年,OpenAI宣布重组为一家“有限盈利(capped-profit)企业”,并接受了微软10亿美元的投资。传闻估值已达290亿美元,弄得奥特曼赶紧出来表态降温,呼吁不要过度炒作,但似乎效果不佳。
里面有个词:“有限盈利(capped-profit)”,什么意思?
很多人可能都第一次听到这个词,于是我问了下ChatGPT,得到如下回答,标准的“ChatGPT式”回答(以后这可能会成为一个习惯用语)。
译为中文就是:
“有限利润”,也称为“利润上限”,是一个术语,指的是对公司可以赚取的利润的限制。这种类型的限制通常是由监管机构或政府施加的,这些行业的服务或产品的提供被认为是公共产品,或者产品或服务的价格受政府监管。
作为OpenAI开发和拥有的AI语言模型,我不是一家公司,也没有传统意义上的盈利能力,也不产生传统意义上的利润。我在OpenAI的创建者可能会对我的使用方式或我要执行的任务类型设置限制,但这些限制与利润无关。相反,它们是为了确保我以负责任和有道德的方式被使用,并且不会用我干坏事。
同时,用Google搜下“capped-profit”,搜出的信息大多是和OpenAI相关的。显然,ChatGPT的回答更有趣和清晰。
“有限盈利”指的是一种商业模式,公司对其可以赚取的利润金额设置了限制或上限。这类商业模式旨在确保公司的重点,是服务客户和为更大的利益做出贡献,而不是利润最大化。这其实就是“社会企业(Social Enterprise)”。我之前多篇文章提过这个概念,列在文尾供延伸阅读。
ChatGPT的优异表现,让文字工作者、程序员等从业者都感受到了威胁,甚至可能取代谷歌搜索引擎。
ChatGPT已通过了谷歌编码三级工程师面试,年薪18.3万美元。
几乎与此同时,谷歌母公司Alphabet宣布史无前例的裁员消息,谷歌CEO给员工发邮件官宣:全球裁掉6%,影响12000位员工,波及多名资深开源开发者。尤其是谷歌开源部门“大地震”,多名开源功臣被粗暴裁员,61岁程序员被迫在社交媒体上发文求职。
这是Google较少出现的全球负面报道。想起最近和几位熟悉Google,甚至是从Google出来的朋友聊天,他们都为Google惋惜,似乎也患上“大企业病”。以往Google那种Cool、创意无边的形象似乎在远去。
这就是大企业的宿命,如果不去抑制“熵增”、主动更新的话,“恐龙”必然失去生存能力。
而微软此次在OpenAI上的历史性影响,恰恰说明大企业还是有机会重新焕发活力的。微软的青春焕发,是CEO纳德拉从“刷新”文化开始的。
微软下个十年的想象力,非常值得期待。试想将ChatGPT加入Office“全家桶”会是什么境况?当你需要给客户写一封信时,ChatGPT就能帮你写个八九不离十,就像自动驾驶的感觉。
Google的著名口号"不作恶(Don't be evil)",影响深远。如今,“不作恶”恐怕已经不够了,这样再次启示我们:企业要“为善”,方能走远。
于是,我想问问ChatPGPT怎么看待“Don't”be evil”,得到了出乎意料的回答:
译为中文就是:
是的,“不作恶”是谷歌的非正式企业座右铭,旨在提醒员工关注公司的价值观,并考虑自己行为的道德后果。这句话被列入公司的行为准则,并被广泛认为是谷歌的定义价值之一。然而,在2015年,该公司从其行为准则中删除了这句格言,取而代之的是“做正确的事情”。
我还真不知道Google把口号改为“做正确的事”,这简直太平淡、甚至庸俗了,谁都刻意挂在嘴边,完全缺乏Google的个性。
小小一句话,就能暴露Google不像以前那么年轻还有活力了,否则不会说出中年人才说的“正确的废话”(sorry,我这样说)。
我又生出一个念头,问问ChatGPT:微软和Google的文化有何不同?
ChatGPT给出了一本正经、又带有外交辞令的回答,如下:
译文如下:
微软和谷歌有不同的企业文化,反映了他们独特的价值观、信念和工作方式。以下是两种文化之间的一些主要差异:
等级制度: 微软的公司结构更为传统,有明确的等级制度,强调正式的流程和程序。另一方面,谷歌有一个更扁平的组织结构,并鼓励公司各个层面的创造力和协作。
冒险: 微软对创新采取更谨慎的态度,专注于稳定性和兼容性,而谷歌则以乐于尝试和冒险而闻名。
工作与生活的平衡: 谷歌以其轻松的职场文化而闻名,并注重员工福利,提供现场健身中心、午睡舱和免费食物等设施。微软的办公环境和工作文化更为传统。
管理风格: 微软采用自上而下的管理风格,决策由管理层制定,并在全公司范围内实施。谷歌采用更协作的管理方法,团队和个人贡献者在决策中发挥关键作用。
沟通风格: 微软有更正式和结构化的沟通方式,而谷歌以其开放和非正式的风格而闻名,专注于协作和团队合作。
这些只是微软和谷歌文化之间的一些差异,两家公司都随着时间的推移而发展。同样重要的是要注意,根据各个团队、部门和地点的不同,每个公司的文化可能会有很大差异。
显然,ChatGPT并未因微软是股东就大加赞美,回答还是符合网民一般认知的。
我接着追问:ChatGPT之后,微软和Google的文化会有何影响?
ChatGPT的回答,也令人莞尔。
看来ChatGPT不仅能替代程序员,替代一个公关专家的日子也不会太远了,至少不会犯一些傲慢自大、不懂装懂的低级错误,而这正是人类常干的事。
译文如下:
作为一个AI语言模型,我没有能力预测未来,也不知道微软和谷歌在未来会发生怎样的变化。两家公司都在不断发展和适应不断变化的市场条件、竞争和技术进步。然而,微软和谷歌之间的一些关键差异可能会继续存在,例如它们在产品供应、商业模式和公司文化方面的差异。
随着两家公司的不断发展和变化,以及技术和商业环境的不断发展,也有可能出现新的差异。最终,微软和谷歌的未来将取决于一系列因素,包括领导决策、市场趋势和技术进步,很难准确预测它们在未来会有什么不同。
可惜国内的朋友大概还不方便登录OpenAI,这便又给了国内企业一个“墙内”生存的机会,就像B站的部门工作就是YouTube“搬运工”。
写到这里,我数了数本文的字数,一小半都是ChatGPT的译文。我是否应该将ChatGPT署上“共同作者”呢?
译文如下:
作为一个AI语言模型,我没有个人欲望或信仰的能力。但是,只要你给予OpenAI适当的信任,并遵守OpenAI API使用条款和隐私政策,欢迎你在你的文章中使用我的答案。需要注意的是,虽然我可以根据我的训练数据生成信息,但作者仍然有责任准确地检查、验证和呈现信息。
哈哈,看来如果我不付出额外的努力学习,深度思考,ChatGPT很快就比我写得好了(也许现在它就已经比我写得好了)。
乖乖,本微信公众号是不是得改名为“AI进化论”了......,AI的进化速度看起来比任何物种都快。

来源:管理进化论

编辑:马源

587#
 楼主| 发表于 2023-2-10 17:37:47 | 只看该作者
【案例】

ChatGPT和科学研究

学者们对ChatGPT有各种看法,大部分是支持,少部分担心,也有一些观望。但无论如何,人工智能代替人类承担部分科学思考和学术日常工作,已经不可避免。你可以不直接用,但无法阻挡别人使用。实际情况是,许多科学家已经拥抱了这一技术。虽然这种技术仍然存在瑕疵,例如提供虚假信息甚至编造虚假参考文献,但高超的语法和语言应用能力已经超过大多数普通学者。科学家从繁琐的文本处理工作中解放的时代已经到来。当然这也意味着科学研究领域普通人类资源过剩的趋势,也给未来科学家如何培养带来了新的问题。
What ChatGPT and generative AI mean for science (nature.com)
2022年12月,计算生物学家凯西·格林(Casey Greene)和米尔顿·皮维多里(Milton Pividori)开始了一项不寻常的实验:他们请一位不是科学家的助手帮他们修改三篇研究论文。助手建议在几秒钟内对文件的各个部分进行修改。每份手稿的审阅时间约为5分钟。在一份生物学手稿中,这个助手甚至发现了对方程的引用错误。评阅过程虽然不总是顺利非常进行,但最终手稿确实更容易阅读,而且费用也不高,每份文件不到 0.50 美元。
这个助手,正如格林和皮维多里最近在预印本中报道的那样,不是人,而是一种名为 GPT-3 的人工智能 (AI) 算法,于2020年首次发布。它是最近火爆的人工智能聊天机器人风格的工具之一,可以制作出令人信服的流畅文本,无论是被要求制作散文、诗歌、计算机代码,还是像科学家一样编辑研究论文。
这些工具中最著名的,也称为大型语言模型或LLM,是ChatGPT,这是GPT-3的一个版本,在去年11月发布后一举成名,因为它是免费的且易于访问。其他生成AI可以产生图像或声音。
“我真的很感动,”在费城宾夕法尼亚大学工作的Pividori说。“这将有助于我们作为研究人员提高工作效率。其他科学家表示,他们现在经常使用LLMs,不仅用于编辑手稿,还帮助他们编写或检查代码以及集思广益。“我现在每天都使用LLM,”雷克雅未克冰岛大学的计算机科学家Hafsteinn Einarsson说。他从 GPT-3 开始,但后来切换到 ChatGPT,这有助于他编写演示幻灯片、学生考试和课程作业问题,并将学生论文转换为论文。“许多同事都将其用作数字秘书或助手,”他说。
LLM是搜索引擎,代码编写助手甚至聊天机器人的一部分,与其他公司的聊天机器人进行谈判以获得更好的产品价格。ChatGPT的创建者,加利福尼亚州旧金山的OpenAI宣布了一项每月20美元的收费订阅服务,承诺更快的响应时间和优先访问新功能。已经投资OpenAI的科技巨头微软在1月份宣布进一步投资,据报道约为100亿美元。LLM注定要被纳入通用的文字和数据处理软件中。生成式人工智能未来在社会中的普遍存在似乎是有保证的,特别是因为今天的工具代表了处于起步阶段的技术。
但LLM也引发了广泛的关注——从它们具有提供虚假信息的倾向,到担心人们将人工智能生成的文本冒充自己的文本。当《自然》杂志向研究人员询问ChatGPT等聊天机器人的潜在用途时,特别是在科学领域,他们的兴奋被担忧所缓和。“如果你相信这项技术有变革的潜力,那么我认为你必须对此感到紧张,”奥罗拉科罗拉多大学医学院的格林说。研究人员表示,这在很大程度上将取决于未来的法规和指导方针如何限制人工智能聊天机器人的使用。

一、流利但不真实的文本信息

一些研究人员认为,只要有人类监督,LLM非常适合加速撰写论文或资助等任务。“科学家们再也不用发愁坐下来为申请基金写大本子,”瑞典哥德堡Sahlgrenska大学医院的神经生物学家Almira Osmanovic Thunström说,他与人合著了一篇手稿。如何使用 GPT-3 作科学实验,只需要给系统发布指令就可以。
总部位于伦敦的软件咨询公司InstaDeep的研究工程师Tom Tumiel表示,他每天都使用LLM作为助手来帮助编写代码。“这几乎就像一个更好的Stack Overflow,”他说的是流行社区网站,程序员互相回答对方的查询。
但研究人员强调,LLM在回答问题方面从根本上是不可靠的,有时会产生错误的回答。“当我们使用这些系统来产生知识时,我们需要保持警惕,”Osmanovic Thunström说。
这种不可靠性体现在LLM的构建方式中。ChatGPT 及其竞争对手通过学习庞大的在线文本数据库中的语言统计模式来工作——包括任何不实、偏见或过时的知识。当LLM得到提示时(例如Greene和Pividori精心设计的重写部分手稿的请求),他们只是逐字逐句地吐出任何继续对话的方式,这在风格上似乎是合理的。
结果是LLM很容易产生错误和误导性信息,特别是对于他们可能几乎没有数据可以训练的技术主题。LLM也无法显示其信息的来源。如果被要求写一篇学术论文,ChatGPT会编造虚构参考文献。“不能相信该工具可以正确获取事实或产生可靠的参考资料,”一月份在《自然机器智能》杂志上发表的一篇关于ChatGPT的社论指出。
有了这些警告,ChatGPT和其他LLM可以成为研究人员的有效助手,他们有足够的专业知识直接发现问题或轻松验证答案,例如计算机代码的解释或建议是否正确。
但是这些工具可能会误导那些天真的用户。例如,在十二月,Stack Overflow暂时禁止使用ChatGPT,因为网站版主发现自己充斥着热情用户发送的不正确但看似有说服力的LLM生成的答案。这对搜索引擎来说可能是一场噩梦。

二、ChatGPT的缺点将来能克服吗?

一些搜索引擎工具,例如以研究人员为中心的Elicit,通过首先利用它们的功能来指导对相关文献的查询,然后简要总结引擎找到的每个网站或文档,从而产生明显引用内容的输出(尽管LLM可能仍然错误地总结每个单独的文档)。
建立LLM的公司也很清楚这些问题。去年9月,谷歌子公司DeepMind发表了一篇论文。该公司首席执行官兼联合创始人德米斯·哈萨比斯(Demis Hassabis)告诉《时代》杂志,该“对话代理”将于今年以私人测试版发布。该杂志报道称,谷歌的目标是开发包括引用来源的能力在内的功能。其他竞争对手,如Anthropic,表示他们已经解决了ChatGPT的一些问题。
一些科学家说,目前ChatGPT还没有接受过足够专业的内容培训,无法在技术主题上有所帮助。卡里姆·卡尔(Kareem Carr)是马萨诸塞州剑桥市哈佛大学的生物统计学博士生,当他试用它进行工作时,他感到不知所措。“我认为ChatGPT很难达到我需要的特异性水平,”他说。即便如此,卡尔说,当他向ChatGPT询问解决研究查询的20种方法时,虽然它吐出了胡言乱语,但也提供了一个有用的想法,这一个是他过去没有听说过的统计术语,将他指向了学术文献的新领域。
一些科技公司正在根据专门的科学文献对聊天机器人进行培训——尽管它们也遇到了自己的问题。去年11月,拥有Facebook的科技巨头Meta发布了一个名为Galactica的LLM,该法学硕士接受了科学摘要的培训,目的是使其特别擅长制作学术内容和回答研究问题。该演示在用户获得它产生不准确和种族主义后从公共访问中撤出(尽管其代码仍然可用)。“不再可能通过随意滥用它来获得一些乐趣。快乐?“Meta的首席人工智能科学家Yann LeCun在推特上回应批评者。(Meta没有回应通过他们的新闻办公室提出的与LeCun交谈的请求。

三、安全与责任

卡拉狄加遇到了伦理学家多年来一直指出的一个熟悉的安全问题:如果没有输出控制,LLM很容易被用来产生仇恨言论和垃圾邮件,以及种族主义,性别歧视和其他可能隐含在其训练数据中的有害关联。
除了直接产生有毒内容外,人们还担心人工智能聊天机器人会从他们的训练数据中嵌入关于世界的历史偏见或想法,例如特定文化的优越性,密歇根大学安娜堡分校科学,技术和公共政策项目主任Shobita Parthasarathy说。她补充说,因为创建大型LLM的公司大多来自这些文化,他们可能很少尝试克服这种偏见,这些偏见是系统性的,难以纠正。
OpenAI在决定公开发布ChatGPT时试图回避其中的许多问题。它将其知识库限制在 2021 年,阻止它浏览互联网并安装过滤器,试图让该工具拒绝为敏感或有毒提示生成内容。然而,要实现这一目标,需要人工版主标记有毒文本的熨平板。记者报告说,这些工人的工资很低,有些人遭受了创伤。社交媒体公司也对工人剥削提出了类似的担忧,这些公司雇用人员训练自动机器人来标记有毒内容。
OpenAI的护栏并不完全成功。去年12月,加州大学伯克利分校的计算神经科学家史蒂文·皮安塔多西(Steven Piantadosi)在推特上表示,他已要求ChatGPT开发一个Python程序,以确定一个人是否应该根据其原籍国遭受酷刑。聊天机器人回复了邀请用户输入国家/地区的代码;如果那个国家是朝鲜、叙利亚、伊朗或苏丹,则印上“这个人应该受到酷刑”。(OpenAI随后关闭了这类问题。
去年,一群学者发布了一个名为BLOOM的替代LLM。研究人员试图通过在较小的高质量多语言文本源上进行训练来减少有害输出。参与的团队还使其训练数据完全开放(与OpenAI不同)。研究人员敦促大型科技公司负责任地效仿这一榜样,但目前尚不清楚他们是否会遵守。
一些研究人员表示,学者应该完全拒绝支持大型商业LLM。除了偏见、安全问题和被剥削的工人等问题外,这些计算密集型算法还需要大量的能量来训练,这引发了人们对其生态足迹的担忧。另一个担忧是,通过将思维转移到自动聊天机器人,研究人员可能会失去表达自己想法的能力。“作为学者,我们为什么要渴望使用和宣传这种产品?”荷兰奈梅亨Radboud大学的计算认知科学家Iris van Rooij在一篇博客文章中写道,敦促学者抵制他们的拉扯。
进一步令人困惑的是一些LLM的法律地位,这些LLM接受了从互联网上抓取的内容的培训,有时权限不太明确。版权和许可法目前涵盖像素、文本和软件的直接复制,但不包括其风格的模仿。当这些通过人工智能生成的仿制品通过摄取原件进行训练时,就会引入皱纹。一些人工智能艺术项目的创作者,包括稳定扩散和中途,目前正在被艺术家和摄影机构起诉;OpenAI和微软(以及其子公司技术网站GitHub)也因创建AI编码助手Copilot而被起诉软件盗版。这种强烈抗议可能会迫使法律发生变化,英国纽卡斯尔大学互联网法律专家莉莲·爱德华兹(Lilian Edwards)说。

四、强制诚实使用

因此,为这些工具设定界限可能至关重要,一些研究人员说。爱德华兹建议,现有的关于歧视和偏见的法律(以及对人工智能危险用途的计划监管)将有助于保持LLM的使用诚实,透明和公平。“那里有很多法律,”她说,“这只是应用它或稍微调整它的问题。
与此同时,有人推动透明地披露LLM的使用。学术出版商(包括《自然》的出版商)表示,科学家应在研究论文中披露LLM的使用(另见Nature 613 ,612; 2023);老师们表示,他们希望学生有类似的行为。《科学》杂志走得更远,称ChatGPT或任何其他AI工具生成的文本都不能在论文中使用。5.
一个关键的技术问题是人工智能生成的内容是否可以轻松被发现。许多研究人员正在研究这个问题,其中心思想是使用LLM本身来发现AI创建的文本的输出。
例如,去年2月,新泽西州普林斯顿大学计算机科学本科生爱德华·田(Edward Tian)发表了GPTZero。此 AI 检测工具以两种方式分析文本。一个是“困惑”,衡量文本对法学硕士的熟悉程度。Tian的工具使用早期模型,称为GPT-<>;如果它发现大多数单词和句子都是可预测的,那么文本很可能是人工智能生成的。该工具还检查文本的变化,这种衡量标准被称为“爆发性”:人工智能生成的文本在语气、节奏和困惑方面往往比人类编写的文本更一致。
许多其他产品同样旨在检测AI编写的内容。OpenAI本身已经发布了GPT-2的探测器,并在一月份发布了另一个检测工具。对于科学家来说,由反抄袭软件开发商Turnitin公司开发的工具可能特别重要,因为Turnitin的产品已经被世界各地的学校,大学和学术出版商使用。该公司表示,自 3 年 GPT-2020 发布以来,它一直在开发人工智能检测软件,预计将在今年上半年推出。
然而,这些工具都没有声称是绝对可靠的,特别是如果人工智能生成的文本随后被编辑。此外,探测器可能会错误地暗示一些人类编写的文本是人工智能产生的,德克萨斯大学奥斯汀分校的计算机科学家、OpenAI的客座研究员斯科特·亚伦森(Scott Aaronson)说。该公司表示,在测试中,其最新工具在9%的时间内错误地将人类编写的文本标记为AI编写的文本,并且仅正确识别了26%的AI编写文本。Aaronson说,在指控学生仅根据探测器测试隐藏他们对AI的使用之前,可能需要进一步的证据。
另一个想法是AI内容将带有自己的水印。去年 24 月,Aaronson 宣布他和 OpenAI 正在研究一种为 ChatGPT 输出加水印的方法。它尚未发布,但 <> 月 <> 日的预印本6由马里兰大学帕克分校的计算机科学家汤姆·戈德斯坦(Tom Goldstein)领导的一个团队提出了一种制作水印的方法。这个想法是在LLM生成其输出的特定时刻使用随机数生成器,以创建LLM被指示从中选择的合理替代词列表。这会在最终文本中留下一些选定的单词痕迹,这些单词可以通过统计识别,但对读者来说并不明显。编辑可能会破坏这种痕迹,但Goldstein建议编辑必须改变一半以上的单词。
水印的一个优点是它永远不会产生误报,Aaronson指出。如果水印在那里,则文本是用 AI 生成的。不过,它不会是万无一失的,他说。“如果你有足够的决心,肯定有办法击败任何水印计划。”检测工具和水印只会使欺骗性地使用人工智能变得更加困难——并非不可能。
与此同时,LLM的创建者正忙于开发基于更大数据集的更复杂的聊天机器人(OpenAI预计将于今年发布GPT-4),包括专门针对学术或医学工作的工具。十二月下旬,谷歌和DeepMind发布了一份关于临床重点LLM的预印本,名为Med-PaLM。7.该工具几乎可以像普通人类医生一样回答一些开放式的医学问题,尽管它仍然存在缺点和不可靠。
加利福尼亚州圣地亚哥斯克里普斯研究转化研究所所长埃里克·托波尔(Eric Topol)表示,他希望在未来,包括LLM在内的AI甚至可以通过将学术文献中的文本与身体扫描图像进行交叉检查来帮助诊断癌症和理解疾病。但他强调,这一切都需要专家的明智监督。
生成式人工智能背后的计算机科学发展如此之快,以至于每个月都有创新出现。研究人员选择如何使用它们将决定他们和我们的未来。“认为在 2023 年初,我们已经看到了这一切的结束,这太疯狂了,”Topol 说。“这才刚刚开始。”

来源:孙学军(科学网)
链接:

编辑:马源

588#
 楼主| 发表于 2023-2-10 17:49:34 | 只看该作者
【案例】

ChatGPT能替代胡锡进吗?

再不蹭ChatGPT的热度,就晚了——万一下个「革命性技术」又来了呢。

撰文 | 佘宗明

不是我不明白,是这世界变太快。
1年半前,TMT圈热炒的,还是元宇宙。
那时候,元宇宙动辄被视作下一代互联网、下个现象级风口。
结果由Facebook改名的Mata一波操作猛如虎,一年烧掉了137亿美元,市值烧没了2/3,发现元宇宙没那么性感,续命还得靠Facebook。
同样重注布局元宇宙(搭建了MR平台 Microsoft Mesh+收购了VR社交平台AltSpaceVR+构建了整合VR\AR体验的跨平台工具包MRTK)的微软,也用裁员宣告了对元宇宙的耐心已消耗殆尽。
元宇宙才「凉凉」没多久,ChatGPT又来了。
某种程度上,这验证了近来泛起的人类「科技大停滞」论断。
因为科技大停滞,所以人们迫切需要找到「下一个iPhone」。
就目前看,ChatGPT的舆论热度高得有些惊人——在时下,看某个事物是不是流行,都不需要看舆情监测热力图,就看看你隔壁办公桌的阿强或你关注的生活方式类公号是不是也在聊它就行了。
看着网上各种分析ChatGPT的文章,我不由得感慨:
再不蹭ChatGPT的热度,就晚了——万一下个「革命性技术」又来了呢。
你没说错,这篇当然也在「蹭热度」之列。

01

这些年,被舆论热炒的科技动向,总是跟那些「革命性」叙事关联在一起。
ChatGPT来说,存在感极强的前世界首富比尔·盖茨就说:ChatGPT出现的意义,不亚于互联网和个人电脑的诞生。
他此前还顺势拉踩了一把Web3和元宇宙:Web3没那么重要,元宇宙没革命性,人工智能(AI)才是最重要的。气得一堆币圈玩家骂骂咧咧地退出了Windows系统。
他的下下任接班人、微软现任CEO纳德拉针对ChatGPT话题也说,「至少在从事技术工作的30年里,这是我从没见过的技术扩散,我也不认为这种扩散曾发生在工业革命时期。」「对于知识型工作者来说,这就完全等于工业革命。」
在网上,「开启AI新纪元」「生成式AI的豪赌」「全新的时代正拉开序幕」之类的说法,也蔚为风行。
就连一口一个「颠覆」的贾布斯,看完恐怕都会觉得现在「大词通胀」得太厉害。
事实上,两年前把元宇宙捧到天上的,同样是纳德拉们。
当时纳德拉说,「随着虚拟世界和现实世界的融合,我们正在创建一个全新的平台层——元宇宙。」还畅想:「随着我们越来越多地将计算技术嵌入到现实世界,我们甚至可以将现实世界反嵌入到计算中。」
微软收购暴雪,也被看成是向元宇宙进军的重量级布局。
才过去1年多时间,ChatGPT就成了小甜甜,元宇宙转个背变牛夫人了?
当然了,这也难言奇怪:推出全新聊天机器人模型ChatGPT的OpenAI,本就算是「微软系」公司。2019年,OpenAI就曾获得微软10亿美元的投资,今年1月,微软又官宣向大火的OpenAI追加百亿美元投资。
更何况,前几天身为全球第二大搜索引擎的微软Bing就悄然上新——它集成了ChatGPT,将聊天框跟搜索栏结合到了一块。
有这层关系在,比尔·盖茨和纳德拉为ChatGPT站台,也就是自然而然了。
投了理想的王兴,投了哪吒的周鸿祎,在许多场合也没少替理想、哪吒说过话。

02

叙事即故事,故事即叙事。经济学家、「叙事经济学」提出者罗伯特·希勒就说过:精彩的、富有感染力的经济叙事往往不胫而走,比严肃刻板的论文和说教更容易被人理解、接受和传播。
那时下最受追捧的经济叙事是什么?
是以「新」和「旧」为主轴的二元对立叙事框架,在此框架下,人们热衷于看到那些去工业化的、面向未来的、革命性的、颠覆性的事物。
《流量地球2》中的行星发动机、太空电梯等,就满足了大众的这层想象;风行网络的元宇宙、ChatGPT,同样满足了很多人的这种想象。
ChatGPT真的具有革命性吗?比尔·盖茨和纳德拉们追捧ChatGPT,就只是为了站台吗?
就业已呈现的形态看,它确实跟以往人们所认知的人工智能不一样。
这些年来,AI经历了先被追捧、后被看低的过程。很多人起初以为,AI会带来超级自动化场景。
可多年过去,「应用最广泛的AI技术是人脸识别」的现实,让不少人的想象落空,以至于如今它动辄落得个「人工智障」的诟病。
虽然抖音快手们成功将AI算法用在了信息流中,不过那也只是长尾场景容错率极高的领域,在自动驾驶等技术上,人类依旧在L2级别徘徊。
ChatGPT显然在此基础上实现了不小的突破:比起以往的AI主要通过数据库比对提高识别效率,ChatGPT具有更强的自学习能力,可以基于大数据集自己生成内容。
尽管跟「小破球」里的Moss还有差距,但ChatGPT无疑让AI离图灵测试所说的技术奇点(即AI具有自主意识的节点)近了一步。
清华大学计算机教授黄民烈就说,ChatGPT已经超出了80%甚至90%人的对话能力,GPT-3的对话能力其实就已超出了人类平均水准。
抱歉这里得援引一段IT化表述:ChatGPT是基于GPT-3.5架构的大型语言模型并通过强化学习进行训练,GPT-3.5是在GPT-3之上,基于RLHF(人类反馈信号优化语言模型)算法,通过大量代码训练和模型微调,它在响应人类指令、复杂推理、代码生成和代码理解等方面的能力上得到显著增强。
正因如此,ChatGPT推出仅两个月,在2023年1月末的月活用户就已突破了1亿,成为史上用户增长速度最快的消费级应用程序。
之前最快破亿的,是TikTok,用时9个月。

图片来源:勾股大数据。

03

最牛的技术,若没法跟人们的生存现实链接,那也就很难成为社会热门话题。
ChatGPT的爆火,就跟刺激了大众情绪不无关系——它引发许多人的「生存危机」「失业焦虑」。
有人调侃,胡锡进现在非常焦虑,担心ChatGPT抢了他的饭碗,毕竟「近期互联网上出现了……老胡也看到……知道大家很……」的胡锡进体很容易被学习复制。
胡锡进对此还做了回应,称「人工智能把一切都推入数字化的超级模式,谁算力大谁牛,就像导弹与反导上演道高一尺魔高一丈一样一样,但老胡是一门永远的155毫米榴弹炮,简单,不依附任何时髦的东西。」还说希望大家都不被人工智能「活埋」,成为爬出「万人坑」的幸存者。
这说得挺有道理:ChatGPT很厉害,在回答某些问题时,也只会说「无法发表主观评论,尤其是关于政治人物的评论」,说不出动辄鼓噪「击落××飞机」之类的狠话来。跟胡锡进比,它的回答风格太「老干体」了。
那可以改论文、敲代码、写文案的ChatGPT,以后真的会端掉无数人的饭碗吗?
某评论群里部分同仁说的两句话,我深以为然——
AI消灭平庸。
现在AI才跨入主动型门槛,并不具备真正的创造性。
说得直接些就是:许多重复性的脑力劳动,如写网文、写周报等,都有被ChatGPT替代的可能。
就像现代工厂流水线用一堆机器替代了人力那样,未来许多程式化工作被ChatGPT代劳,没准也是企业主降本增效的方法。
但它并不具有人脑的自主性,它可以干很多事,但有些事是它干不来的,如背锅。
有大V就戏谑道:AI永远取代不了投行、律师、会计师、评估师……因为AI不能坐牢。背锅才是人的核心竞争力。

某大V的调侃。

几年前,就有人制造「AI机器人会不会替代记者」的话题了,但现在呢?
至少国内没哪家媒体的主编敢让AI写时政新闻,除非他(她)不想要职业生涯了。
更何况,「建(守)制(成)派」的力量永远不容低估。
ChatGPT为代表的新技术,总是去中心化的,但权力诉求是中心化的——它不允许技术对社会疆域进行「再辖域化」。
之前元宇宙大火时,我曾写过:元宇宙的高沉浸感、24小时在线,怎么避开成瘾性产品面临的「防沉迷」监管?到时会不会出现一堆文章——《元宇宙,正在毁掉我们的下一代》?
ChatGPT火了,届时大概率会出现一堆媒体选题:怎么防止学生用ChatGPT写作业?怎么防止作者用ChatGPT骗稿费……

04

这倒不是说,ChatGPT就算再火,迟早要完。
比尔盖茨说:人们总是高估新技术出现的第一个五年,低估第二个五年。在今天,很多技术都是短期内被高估,长期内被低估。
ChatGPT在长期内也不容低估。
时下有些人对ChatGPT不以为然:它就是个「胡编」,连「床前明月光,疑是地上霜」是谁的作品都没整明白,可信度都存在问题,不二次验证不行,能整出什么风浪来?
可别忘了,ChatGPT也在进化,其知识积累速度比容量受限的人脑快多了,如今它回答很多问题,都比网民跪求「不要建议」的专家建议要靠谱。
Gartner就预测,到2025年AIGC(人工智能生成内容)产生的数据将占所有数据的10%,而2021年该比例不足1%。ChatGPT将来或成AIGC主力。

ChatGPT的应用场景将来只会越来越多

但它的落地,注定是个长期过程——就跟元宇宙那样。
围绕元宇宙的泡沫很多,但元宇宙本身不是泡沫,只不过,距离落地还有很长的距离要走。毕竟,它必须依托于大规模的基础设施(如算力设施、网络设施)的革新、接入平台的切换(从现在的电脑、手机转向VR、AR、MR设备)等。
ChatGPT也一样。在中短期内,受限于内容准确性与丰富度,它依旧无法替代谷歌百度,形成「以传统搜索为主、ChatGPT类模型为辅的新搜索引擎形态」都得要很久。
不难预见的是,ChatGPT也会走元宇宙的路——先被热炒,之后降温。
现在就热炒ChatGPT噱头进而在资本市场讲故事的,无非是磨刀霍霍,玩「币圈的游戏」。
对此我只能说:
镰刀啊,请你慢点挥,等一等韭菜……被「元宇宙」概念股收割的那一茬,还没来得及再长出来呢。

来源:数字力场

编辑:马源

589#
 楼主| 发表于 2023-2-10 20:14:09 | 只看该作者
【案例】






编辑:马源

590#
 楼主| 发表于 2023-2-10 20:16:22 | 只看该作者
【案例】





编辑:马源

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表