【案例】
7 f Y1 }4 |& [ n# e) u9 Y, T- W( R `) x6 |. C# e5 E
GPT-4「变懒」bug被修复,价格暴降80%!OpenAI连更5款新模型,性能狂飙 新智元 2024-01-26 12:18 发表于北京
& S C( U; h; Q& d! O$ I1 U% q新智元报道 编辑:编辑部
- { S+ \2 @8 ]/ a9 { 【新智元导读】昨夜,OpenAI一口气连更5款新模型。GPT-4 Turbo变懒问题修复,代码生成能力史诗级加强。另外,多款模型价格大幅暴降。
% ~1 ~! u0 q8 ]( }* B. @' ?
" r. s3 b' @/ O0 [, m
# ]% F) w% V- W X+ y' M' a/ u GPT-4又双叒叕变强了!5 U% z2 y: `- o& a M5 N
) R. i3 U% D3 Q0 S
今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。
% K4 N+ }1 O& e( }* a) Y+ z5 k$ z3 `% a! Y
不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。! K4 F8 x3 m5 a: C0 Z# w$ S
7 ]4 A" U5 {# t# L! c/ E! c( k# K- ~+ F/ ?5 E, D
+ o5 `% r: V9 S# z+ ? H0 w
与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
9 K) }% h* ^( }4 p: ^
$ I# u B \7 [" T9 b; g9 h- H1 t. X0 } - GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
/ m6 D" e2 I1 m4 q E9 H
) W x* i$ \, T; D* P2 e$ W - 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
* }+ ]* h f2 b* ~' M5 i
* J+ u4 P( N8 K/ F) Q: j 两个新一代embedding模型:7 q: S3 w$ v0 z9 T2 W
* C0 P I2 Z7 T s: I2 E& T
- text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。; L) j, P4 P6 _3 p
- text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
! A( B5 B T5 ~; x( @7 m 最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。; n0 b- W7 l8 ~- c
$ O, Y9 C- M4 U- I& p. r* a0 t, D) N/ d8 Y% P r/ I* U9 t
5 u) }' @; k! w& H* ]2 d GPT-4更强了,变懒bug修复 自从去年11月份开发者大会发布GPT-4-Turbo以来,超过70%的GPT-4 API用户已经转用了GPT-4-Turbo预览版,从而能够享受最新的知识戒指日期、更大的128k上下文窗口和更低的价格。. F( u3 r0 I: q$ X& o/ K( R) V9 g
2 X7 `7 _/ @" i; Q) h! J
最新更新的GPT-4-Turbo 预览模型——gpt-4-0125-preview在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。5 k6 w x9 [$ _+ N ^8 w6 G
9 H' W, x& c8 R8 E) ~1 _
新模型还修复了一个影响非英文UTF-8生成的漏洞。0 i! d* l/ \9 \2 @
对于那些希望自动升级到最新GPT-4-Turbo预览版的用户,OpenAI还推出了一个新的模型名别名gpt-4-turbo-preview,它将始终指向最新的GPT-4-Turbo预览版模型。8 Z) O7 d( r- Z s9 K, s& j
4 ^1 J9 q n& t/ T% R+ G- ~ 在未来几个月内,OpenAI还会推出具备视觉功能的GPT-4-Turbo正式版。
9 `0 u% J4 p0 S$ Z' j+ ~, _* `' F
% K' A: c3 a+ b9 X
GPT-3.5-Turbo喜迎「降价增效」 下周,OpenAI即将推出新版的GPT-3.5-Turbo,型号为gpt-3.5-turbo-0125。
+ m* P! _( }# d( q+ x2 `+ h/ L0 E6 d8 ~& U( g
在过去的一年里,OpenAI已经第三次下调GPT-3.5-Turbo的价格。
/ Z6 m$ n C7 j. ^
' ~# ^4 J8 A* S 新模型的输入价格下降了50%,现为0.0005美元/1k token;输出价格下降了 25%,现为0.0015美元/1k token。2 H2 M3 A5 x5 S- u
此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。
% \" h# F7 D. M
: c7 j" |5 M# a6 R# v+ D 在API中使用固定gpt-3.5-turbo模型名称的用户,将在这款新模型推出两周后,自动从gpt-3.5-turbo-0613升级至gpt-3.5-turbo-0125版本。7 _4 I& ^+ Z; `: h/ | m
2 f0 O/ {" s5 X, W1 R1 Q5 U/ w* p& A
: z& N0 U- g5 x9 m5 I% x 全新嵌入模型2连发:性能大涨价格狂降 OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。2 U& O7 Z, [' q' `: B# o
5 z+ n2 Y8 e$ D+ v8 I5 q7 |& C& z7 x5 B
$ C. w# P8 f' V
所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。6 Q% [" _1 {, K2 U" }, e
通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。4 g, B, o" T% Y/ o, f7 R
. L. V; B$ t! d/ i9 ?- g
嵌入技术为 ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成([color=var(--weui-LINK)][url=]RAG[/url])开发工具提供了强大动力。0 [ D7 d! \7 R: i( m; l$ k: z: l: l
「小」文本嵌入模型:text-embedding-3-smalltext-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。. ~ t& ]- T& O% g2 o; e. M& w/ f
+ W! ~: R, s7 [" r6 J
! K$ q; R9 X/ ^2 g, I# s - 性能更强/ \2 a, ]8 i6 C$ H7 T/ X# Z o
8 a3 u* ]3 ~# |2 X 在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small的平均得分从31.4%提高到44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从61.0%提高到 62.3%。! L) V9 r. L; t/ B) E
+ f/ z$ o6 Q) z$ k1 X3 [
- ^$ |0 K! V% z5 W - 价格实惠- t5 y* t9 r- w O. b
* v7 w8 M* T/ ~3 b3 c; S; |
text-embedding-3-small远比OpenAI之前的text-embedding-ada-002模型效率高,因此价格也大幅降低了5倍,从每千token的0.0001美元降至0.00002美元。
8 ^8 R. X1 q1 ]; [% \2 f
0 z) W, e0 H5 B$ U0 t; S, q% P9 H OpenAI不会停用text-embedding-ada-002,尽管OpenAI更推荐用户使用新模型,客户仍可选择继续使用上一代产品。$ u. U% d+ f# d8 H1 o% y0 W/ `
: U Z c- L1 c
+ t2 ?) s8 W- n+ z8 R「大」文本嵌入模型:text-embedding-3-large
, r! V- o* u# y2 o/ Y9 v
! J; ~; Y9 R) H5 o# } text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。' @, s. Y/ p% H, S. k, p
text-embedding-3-large是OpenAI目前性能最强的模型——
" K& K, \3 @$ g, V4 [
5 P7 r6 s& V3 M# R" b 与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
& w8 R5 J! f9 Y; s- J0 _8 r. z' |" N z5 |- m2 @0 _
$ R: D0 B3 o- }: W) B& ]9 S
$ @' B+ ?5 _! z4 a7 ]& r text-embedding-3-large的价格定为0.00013美元/1k token。
# X9 `7 s0 `4 E8 H+ K, j0 X) Y, h% u% Q) a0 f9 Y
# z b+ h* t) ~0 T' x$ H/ J
7 W1 t7 j1 I; |( d8 V O7 X$ r$ I* n# S) m/ H' K
灵活调整嵌入向量# Q: L: P$ o1 `, [3 [
: y0 o0 d2 b; e& R3 e
相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。
/ s( r- K; x9 ]5 [ T" E; {, v( i4 j% Y' X! G
OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。' v y' Z4 Y& F. q: I# c
具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。& m7 f. h, y8 n- Q; E
C+ P, t2 a. r+ i. l2 c+ X/ u 例如,在MTEB基准测试中,即使将text-embedding-3-large嵌入向量的长度缩减到 256,它的性能仍然超过了长度为1536的未经缩减的text-embedding-ada-002嵌入向量。
: |# f" S5 R8 S- }4 ]# r& ] 这种做法极大地增加了使用上的灵活性。
2 f" ~3 z5 N& n' d }: |' E" `, @+ H& X+ u' O2 V
比如说,当开发者需要使用一个只支持最大1024维度嵌入向量的向量数据存储时,可以选择OpenAI性能最佳的嵌入模型text-embedding-3-large,并通过设置dimensions API参数为1024,从而将原本3072维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。% Y) T. J1 f* L2 W1 O( t
2 Y/ L3 P8 j/ Q3 W# ?2 d
- u" h9 p. v6 J; c& y. O0 h" }% X$ D/ S+ p* C' Q
迄今最强的内容审核模型 OpenAI提供的免费内容审核API可以帮助开发者识别可能有害的文本。
) N: Z& w$ u" D1 m+ D, [; a% N( N' ?4 z( R$ ]
作为OpenAI持续安全工作的一部分,OpenAI发布了迄今为止最强大的内容审核模型text-moderation-007。$ a7 f( P' B& K% h
* C' Y$ x: G! D" d8 h 此前的text-moderation-latest和text-moderation-stable,也将重新指向这个新模型。. ` @( R* S9 X6 Q8 G6 S5 M: T/ A; d
! u9 \( s7 [" s5 t7 I
# \: X5 o8 c% Z. p6 e! x API后台更新,更好的API密钥管理 OpenAI正在推出两项重要的平台升级,旨在为开发者提供对他们的API使用情况更清晰的洞察,并加强对API密钥的管理。
. E/ ?& L5 N' P, d. f8 F% J* Q% t# n: k# u' _. z) W, D
首先,开发者可以直接在API密钥页面设置不同的密钥权限。
/ u( b' I* i1 [" V1 t# A$ M8 Y9 f: o
' w: i6 O7 D7 G 举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。
" G. [2 M3 k* [$ ^; s5 c 其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。
# L. G% a8 h: Y
+ H# P! [4 Q! L; {& |2 S 在接下来的几个月里,OpenAI计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。
9 z' x. L) m6 u7 b+ Y+ U
1 @( |7 t. a2 |3 q# ^) p$ T
3 |2 z4 C* r2 H) r- X8 w# O. a8 J# x) a2 j
0 m) {; F( N# Q# I/ g, z( P& u( e; y& R ( ?5 f7 j) `5 `" d/ R$ q
- M2 e0 z# {8 T! }5 b I# O; W
7 \/ r( j, }6 I) h |