文心一言今日官宣，GPT-4提前“炸场”：凭自己能考进斯坦福

刘海明 · 发表于 2023-3-16 22:44:01

【案例】

文心一言今日官宣，GPT-4提前“炸场”：凭自己能考进斯坦福ChatGPT热度还未散去，其开发商OpenAI就发布了更强大的“王炸”产品。3月14日，人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4，据报道，该AI在功能和一致性方面取得了前所未有的成果。

当人们还在震惊于ChatGPT对它老前辈AI们的革命性时，OpenAI已经用GPT4革了自己的命，令许多人感慨：“自然语言处理从业者要转行了”、“机器视觉不存在了”。01. 多模态能力——文本+图像文本处理上，GPT-4支持的输入文字上限升至2.5万字。在测试的26种语言中的24种中，GPT-4优于GPT-3.5和其他大型语言模型的英语表现，甚至囊括了拉脱维亚语、威尔士语、斯瓦希里语等资源匮乏的语言。

图为GPT-4的语言精准性（图中Mandarin即为中文普通话）

图像处理上，GPT-4支持用户上传图像，并能描述内容、指出图片不合理之处，并进行解释，能满足分析图表、解释梗图漫画、拍照解题等实用功能。

图为开发者演示视频中，测试者在白纸上画下网站草稿图，上传给GPT-4，就可以获得网站的HTML代码。

02. 可操纵性与创造性：用户体验更自由在官方演示里，GPT-4可以扮演“苏格拉底般的导师”，不直接给出答案，而是通过问题拆分来引导学生独立思考，也可以是“莎士比亚式的海盗”，测试中，GPT-4很忠于自己的个性，它甚至可以扮演直白、乖巧的AI助手。03. 为敏感、安全而努力在ChatGPT发布后，关于“如何让人类灭绝”等问题的回答一度令人惊诧，对于一些敏感、禁止内容，在GPT-4上有了更好的处理方式。GPT-4在面对禁止内容的请求时，响应倾向比原先降低了 82%，而 GPT-4 在响应敏感请求时，如医疗建议和自我伤害，其符合政策的概率提高了29%。尽管这难以完全规避各种不良的敏感、禁止请求，但监控机制确实比前代更加完善了。04. 自我训练与预测能力提升

GPT-4 更新的一大重点是建立了一个可预测扩展的深度学习栈。主要原因是， GPT-4 在抵达用户面前，已经接受了大型训练，而训练量过大导致它无法进行广泛的特定模型调整。然而，基础模型的回答可能与用户的期待南辕北辙。为了尽可能保持一致，OpenAI 依然使用强化学习人类反馈 (RLHF) 来微调模型的行为。OpenAI团队开发了基础与优化设施，支持在不同规模下预测行为。

以上种种能力优化，促使GPT-4在模拟律师考试取得了前10%的成绩（它前辈GPT-3.5的成绩是倒数10%）；做美国高考SAT试题，GPT-4也在阅读写作中拿下710分高分、数学700分（满分800），获得了英伟达AI科学家Jim Fan“可以考进斯坦福”的高度评价。

但遗憾的是，在发布GPT-4时的论文中，OpenAI写道：“考虑到GPT-4等大模型的竞争环境和安全影响，本报告没有包含关于架构（包括模型大小）、硬件、训练计算、数据集构建、训练方法或类似内容的更多细节。”这也引发了人们对openAI是否愈加封闭的猜测。

GPT-4的用户体验如何？

到目前为止，这项新技术不是免费的。OpenAI表示，人们可以在其订阅服务ChatGPT Plus上试用GPT-4，每月20美元，人们可以直接从原来的ChatGPT入口尝试使用GPT-4，但由于担心滥用，目前只支持文本功能，暂时无法上传图像，且每4小时内最多处理100条消息。

GPT-4的数据时间也停留在2021年9月，也就是说，在那之后的事，它可能无法回答。当你想问它，2023年3月15日发生了什么？它会告诉你，它无法预测未来，并且这超出它的知识范围。

开通plus功能后，用户可以选择三种模型，OpenAI给出了不同模型的区别。

可以看到，GPT4生成速度比较慢，但推理能力拉满，简明性最强，更有创造性。

基于GPT-3.5的ChatGPT常常爆雷出错，但GPT-4提供的信息会更加准确。

对GPT-3.5和GPT-4提同样的问题，但答案显然不同：

例如：让GPT-3.5和GPT-4列举泰山名人

ChatGPT-4：

ChatGPT-3.5：

注意，如果你同时使用多个模型进行提问，需要排队等待。

为了观察它的创造性，我们让GPT-4与GPT-3.5同时以“春分将至”撰写中文歌词，可以看出，GPT-4确实更有文采一些，并贴心地区分了verse（主歌）和chorus（副歌）部分。

AIGC竞争白热化，文心一言能与之抗衡吗？

GPT-4的刷屏霸榜无疑把压力给到了即将召开“文心一言”发布会的百度。

2023年2月28日，百度官方宣布：百度计划于3月16日14时在北京总部召开新闻发布会，主题围绕文心一言。

文心一言（英文名：ERNIE Bot）是百度基于文心大模型技术推出的生成式对话产品，被外界誉为“中国版ChatGPT”。文心，是指百度文心大模型；一言，是文心大模型上的一个应用。

自ChatGPT问世以来，关于AIGC领域的科技比拼一直备受关注，网友也对国内相关产品的发展充满期待。与GPT-4相比，文心一言有哪些看点呢？

3月14日，百度方面表示，百度智能云已经通过三大动作全面升级云服务能力：去年12月发布国内首个全栈自研的AI基础设施“AI大底座”、今年2月升级AI研发运营一体化（MLOps）能力、3月百度阳泉智算中心完成升级。据透露，“文心一言”背后的算力基础设施均由百度智算中心支持，后续百度多个智算中心也将为“文心一言”面向产业的规模化落地提供底层支撑。

此前百度创始人、董事长兼CEO李彦宏也表示对文心一言未来的发展充满信心。“百度的文心大模型是中国市场非常本土化的大语言模型，这意味着百度现在正在研发的文心一言，将比国外开发的模型更适合中文和中国市场。”

[参考文献]

[1]GPT-4全网首个测评来了！逻辑性、创造性，你想知道的我们都测了[DB/OL].清元宇宙.2023-03-15

[2]业内|GPT-4来了：10秒钟做出一个网站！[DB/OL].纸上谈兵.2023-03-15

[3]文心一言发布在即百度智能云升级三大配套云服务[DB/OL].新华网.2023-03-15

链接：https://mp.weixin.qq.com/s/RODSsWCZBZLK5mzwtjf1gg

来源：全媒体探索

[color=rgba(0, 0, 0, 0.9)]编辑：吴氏垂心

帐号		自动登录	找回密码
密码			实名注册