传媒教育网

 找回密码
 实名注册

QQ登录

只需一步,快速开始

搜索
做个试验
查看: 173|回复: 0
打印 上一主题 下一主题

文心一言今日官宣,GPT-4提前“炸场”:凭自己能考进斯坦福

[复制链接]
跳转到指定楼层
楼主
发表于 2023-3-16 22:44:01 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
【案例】
文心一言今日官宣,GPT-4提前炸场:凭自己能考进斯坦福ChatGPT热度还未散去,其开发商OpenAI就发布了更强大的王炸产品。314日,人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4,据报道,该AI在功能和一致性方面取得了前所未有的成果。

当人们还在震惊于ChatGPT对它老前辈AI们的革命性时,OpenAI已经用GPT4革了自己的命,令许多人感慨:自然语言处理从业者要转行了机器视觉不存在了01.      多模态能力——文本+图像文本处理上,GPT-4支持的输入文字上限升至2.5万字。在测试的26种语言中的24种中,GPT-4优于GPT-3.5和其他大型语言模型的英语表现,甚至囊括了拉脱维亚语、威尔士语、斯瓦希里语等资源匮乏的语言。

图为GPT-4的语言精准性(图中Mandarin即为中文普通话)
图像处理上,GPT-4支持用户上传图像,并能描述内容、指出图片不合理之处,并进行解释,能满足分析图表、解释梗图漫画、拍照解题等实用功能。
图为开发者演示视频中,测试者在白纸上画下网站草稿图,上传给GPT-4,就可以获得网站的HTML代码。
02.      可操纵性与创造性:用户体验更自由在官方演示里,GPT-4可以扮演苏格拉底般的导师,不直接给出答案,而是通过问题拆分来引导学生独立思考,也可以是莎士比亚式的海盗,测试中,GPT-4很忠于自己的个性,它甚至可以扮演直白、乖巧的AI助手。03.      为敏感、安全而努力ChatGPT发布后,关于如何让人类灭绝等问题的回答一度令人惊诧,对于一些敏感、禁止内容,在GPT-4上有了更好的处理方式。GPT-4在面对禁止内容的请求时,响应倾向比原先降低了 82%,而 GPT-4 在响应敏感请求时,如医疗建议和自我伤害,其符合政策的概率提高了29%。尽管这难以完全规避各种不良的敏感、禁止请求,但监控机制确实比前代更加完善了。04.      自我训练与预测能力提升
GPT-4 更新的一大重点是建立了一个可预测扩展的深度学习栈。主要原因是, GPT-4 在抵达用户面前,已经接受了大型训练,而训练量过大导致它无法进行广泛的特定模型调整。然而,基础模型的回答可能与用户的期待南辕北辙。为了尽可能保持一致,OpenAI 依然使用强化学习人类反馈 (RLHF) 来微调模型的行为。OpenAI团队开发了基础与优化设施,支持在不同规模下预测行为。
以上种种能力优化,促使GPT-4在模拟律师考试取得了前10%的成绩(它前辈GPT-3.5的成绩是倒数10%);做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800),获得了英伟达AI科学家Jim Fan“可以考进斯坦福”的高度评价。
但遗憾的是,在发布GPT-4时的论文中,OpenAI写道:“考虑到GPT-4等大模型的竞争环境和安全影响,本报告没有包含关于架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法或类似内容的更多细节。”这也引发了人们对openAI是否愈加封闭的猜测。
GPT-4的用户体验如何?
到目前为止,这项新技术不是免费的。OpenAI表示,人们可以在其订阅服务ChatGPT Plus上试用GPT-4,每月20美元,人们可以直接从原来的ChatGPT入口尝试使用GPT-4,但由于担心滥用,目前只支持文本功能,暂时无法上传图像,且每4小时内最多处理100条消息。
GPT-4的数据时间也停留在2021年9月,也就是说,在那之后的事,它可能无法回答。当你想问它,2023年3月15日发生了什么?它会告诉你,它无法预测未来,并且这超出它的知识范围。
开通plus功能后,用户可以选择三种模型,OpenAI给出了不同模型的区别。
可以看到,GPT4生成速度比较慢,但推理能力拉满,简明性最强,更有创造性。
基于GPT-3.5的ChatGPT常常爆雷出错,但GPT-4提供的信息会更加准确。
对GPT-3.5和GPT-4提同样的问题,但答案显然不同:
例如:让GPT-3.5和GPT-4列举泰山名人
ChatGPT-4:
ChatGPT-3.5:
注意,如果你同时使用多个模型进行提问,需要排队等待。
为了观察它的创造性,我们让GPT-4与GPT-3.5同时以“春分将至”撰写中文歌词,可以看出,GPT-4确实更有文采一些,并贴心地区分了verse(主歌)和chorus(副歌)部分。
AIGC竞争白热化,文心一言能与之抗衡吗?
GPT-4的刷屏霸榜无疑把压力给到了即将召开“文心一言”发布会的百度。
2023年2月28日,百度官方宣布:百度计划于3月16日14时在北京总部召开新闻发布会,主题围绕文心一言。
文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品,被外界誉为中国版ChatGPT”。文心,是指百度文心大模型;一言,是文心大模型上的一个应用。
自ChatGPT问世以来,关于AIGC领域的科技比拼一直备受关注,网友也对国内相关产品的发展充满期待。与GPT-4相比,文心一言有哪些看点呢?
3月14日,百度方面表示,百度智能云已经通过三大动作全面升级云服务能力:去年12月发布国内首个全栈自研的AI基础设施“AI大底座”、今年2月升级AI研发运营一体化(MLOps)能力、3月百度阳泉智算中心完成升级。据透露,“文心一言”背后的算力基础设施均由百度智算中心支持,后续百度多个智算中心也将为“文心一言”面向产业的规模化落地提供底层支撑。
此前百度创始人、董事长兼CEO李彦宏也表示对文心一言未来的发展充满信心。百度的文心大模型是中国市场非常本土化的大语言模型,这意味着百度现在正在研发的文心一言,将比国外开发的模型更适合中文和中国市场。


[参考文献]
[1]GPT-4全网首个测评来了!逻辑性、创造性,你想知道的我们都测了[DB/OL].清元宇宙.2023-03-15
[2]业内|GPT-4来了:10秒钟做出一个网站![DB/OL].纸上谈兵.2023-03-15
[3]文心一言发布在即 百度智能云升级三大配套云服务[DB/OL].新华网.2023-03-15
来源:全媒体探索
[color=rgba(0, 0, 0, 0.9)]编辑:吴氏垂心

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持 反对反对

发表回复

您需要登录后才可以回帖 登录 | 实名注册

本版积分规则

掌上论坛|小黑屋|传媒教育网 ( 蜀ICP备16019560号-1

Copyright 2013 小马版权所有 All Rights Reserved.

Powered by Discuz! X3.2

© 2016-2022 Comsenz Inc.

快速回复 返回顶部 返回列表