冯志伟等：为何乔姆斯基对ChatGPT持否定态度？

刘海明 · 发表于 2024-1-26 09:28:04

【案例】

冯志伟等：为何乔姆斯基对ChatGPT持否定态度？

本文比较了乔姆斯基关于语言知识的本质、来源和使用的理论与 GPT 的不同，说明了GPT没有可解释性。

2023年3月8日著名语言学家乔姆斯基与罗伯茨（Ian Roberts）、瓦图穆尔（Jeffrey Watmull）共同在《纽约时报》发表了题为“ChatGPT的虚假承诺”的文章。他们强调，人工智能和人类在思考方式、学习语言与生成解释的能力，以及道德思考方面有着极大的差异，并提醒读者如果ChatGPT式机器学习程序继续主导人工智能领域，那么人类的科学水平以及道德标准都可能因此降低。乔姆斯基还认为，ChatGPT使用的大语言模型，实质上是一种剽窃。

乔姆斯基对于GPT持否定态度，这是不足为奇的。在乔姆斯基生成语法（Generative Grammar）的发展过程中，赋予生成语法以生命活力的是生成语法的语言哲学理论。其中，最为重要的是关于人类知识的本质、来源和使用问题（Chomsky，1995）。乔姆斯基把语言知识的本质问题叫做“洪堡特问题”（Humboldt's problem）。

德国学者洪堡特（W. Humboldt）曾经提出“语言绝不是产品（Ergon），而是一种创造性活动（Energeria）”，语言实际上是心智不断重复的活动，它使音节得以成为思想的表达。人类语言知识的本质就是语言知识如何构成的问题，其核心是洪堡特指出的“有限手段的无限使用”。语言知识的本质在于人类成员的心智/大脑（mind/brain）中，存在着一套语言认知系统，这样的认知系统表现为某种数量有限原则和规则体系。高度抽象的语法规则构成了语言应用所需要的语言知识，由于人们不能自觉地意识到这些抽象的语法规则，乔姆斯基主张,这些语言知识是一些不言而喻的或者无意识的知识.

乔姆斯基主张把语言知识和语言的使用能力区分开来。两个人拥有同一语言的知识，他们在发音、词汇知识、对于句子结构的掌握等方面是一样的。但是，这两个人可能在语言使用的能力方面表现得非常不同。因此，语言知识和语言能力是两个不同的概念。语言能力可以改进，而语言知识则保持不变。语言能力可以损伤或者消失，而人们并不至于失去语言知识。所以，语言知识是内在于心智的特征和表现，语言能力是外在行为的表现。生成语法研究的是语言的心智知识，而不是语言的行为能力。语言知识体现为存在于心智/大脑中的认知系统。

GPT采用的数据驱动的“端到端嵌入”技术对于非人类的自然语言行为是行之有效的，但是，这种技术是处于人类的心智之外的，根本不存在“有限手段的无限使用”问题，与乔姆斯基对于语言知识本质的认识是迥然不同的。

语言知识的来源问题，是西方哲学中的“柏拉图问题”（Plato’s problem）的一个特例。“柏拉图问题”是：我们可以得到的经验明证是如此贫乏，而我们是怎样获得如此丰富和具体明确的知识、如此复杂的信念和理智系统呢？人与世界的接触是那么短暂、狭隘、有限，为什么能知道那么多的事情呢？刺激的贫乏（stimulus poverty）和所获得的知识之间为什么会存在如此巨大的差异呢？（杨小璐，2004）与“柏拉图问题”相应，人类语言知识的来源问题是：为什么人类儿童在较少直接语言经验的情况下，能够快速一致地学会语言？乔姆斯基认为，在人类成员的心智/大脑中存在着由生物遗传而天赋决定的认知机制系统。在适当的经验引发或一定的经验环境下，这些认知系统得以正常地生长和成熟。这些认知系统叫做“心智器官”（mental organs）。决定构成人类语言知识的是心智器官中的一个系统，叫做“语言机能”（language faculty）。这个语言机能在经验环境引发下的生长和成熟，决定着人类语言知识的获得（Pullum & Scholz，2002）。

研究发现，FOXP2是人类的独特基因。这一基因与其他哺乳动物的类似基因同属于一个家族，然而，这基因的排序却是人类特有的。因此，FOXP2也许就是乔姆斯基所假设的“语言机能”的生物学基础。由于存在FOXP2，所以，语言是天赋的，FOXP2给语言天赋论和刺激贫乏论提供了生物学上的支持（俞建梁，2011）

语言机能有初始状态（initial state）和获得状态（attained state）。初始状态是人类共同的、普遍一致的；获得状态是具体的、个别的。语言机能的初始状态叫做“普遍语法”（Universal Grammar，UG），语言机能的获得状态叫做“具体语法”（Particular Grammar，PG）。对普遍语法的本质特征及其与具体语法的关系的研究和确定，是解决关于语言知识的“柏拉图问题”的关键。

GPT采用的数据驱动的“端到端嵌入”技术对于非人类的自然语言机器学习是行之有效的，但是，这种技术依靠大规模的语言数据，根本不存在“刺激贫乏”的问题，与乔姆斯基对于语言知识来源的认识是大相径庭的。

乔姆斯基把语言知识的使用问题叫做“笛卡儿问题”（Cartesian problem）。基于机械论哲学的物质概念，法国哲学家和数学家笛卡儿（Descartes）认为，所有非生命物质世界的现象、动物的生理与行为、大部分的人类器官活动，都能够纳入物质科学（science of body）的范畴。但是。笛卡儿又指出，某些现象不能处于物质科学的范畴之内，其中最为显著的就是人类语言，特别是“语言使用的创造性方面”，更是超出了机械论的物质概念所能够解释的范围。所以，对于语言的正常使用，是人类与其他动物或机器的真正区别。为了寻求对于语言这一类现象的解释，笛卡儿设定了一种“第二实体”的存在，这种第二实体就是“思维实体’（thinking substance）。“思维实体”明显不同于物质实体，它与物质实体相分离，并通过某种方式与物质实体相互作用。这一种“思维实体”就是心灵或者心智。语言知识的使用是内在于心智/大脑的。因此，对于这样的问题是很难解决和回答的。

GPT采用的数据驱动的“端到端嵌入”技术对于非人类自然语言的使用是行之有效的，但是，这种技术与“思维实体”没有关系，与乔姆斯基对于语言知识使用的认识是完全不同的。乔姆斯基主张，语言是语言机能或者语言器官所呈现的状态，说某个人具有语言L，就是说他的语言技能处于状态L。语言机能所获得的状态能够生成无限数目的语言表达式，每一个表达式都是语音、结构和语义特征的某种排列组合。这个语言机能所获得的状态是一个生成系统或者运算系统。

为了与一般人理解的外在语言相区别。乔姆斯基把这样的运算系统，叫做“I语言”。字母I代表内在的（internal）、个体的（individual）、内涵的（intensional）等概念。这意味着，I语言是心智的组成部分，最终表现于大脑的神经机制之中，因此，I语言是“内在的”。I语言直接与个体有关，与语言社团存在间接的联系。语言社团的存在取决于该社团的成员具有相似的I语言，因此，I语言是“个体的”。I语言是一个函数或者生成程序，它生成一系列内在地表现与心智/大脑中的结构描写，因此I语言是“内涵的”。根据这种对于I语言的认识。乔姆斯基指出，基于社会政治和规范目的论因素之上的关于语言的通常概念，与科学的语言学研究没有任何关系，这些概念都不适合用来进行科学的语言研究。

生成语法对于语言的科学认识是内在主义（internalist）的，而GPT的大语言模型则是外在主义的（externalist）。GPT的方法是在广泛搜集语言材料的基础上，把离散的语言符号转化为词向量，通过机器学习来获取概率性的语言参数。这些参数存在于外部世界，处于人类的心智/大脑之外。GPT的方法是经验主义的方法，这种方法的基础是外在主义的语言观。乔姆斯基认为，根据外在主义的语言观，人们不能正确地认识和揭示人类语言的本质特征，不能解释人类语言知识获得的过程。只有内在主义的语言观才有可能正确地、全面地认识和解释人类语言知识的本质、来源和使用等问题。

乔姆斯基认为，生成语法的研究应当遵循自然科学研究中的“伽利略-牛顿风格”（Galilean-Newtonianstyle）。“伽利略风格”的核心内容是：人们正在构建的理论体系是确实的真理，由于存在过多的因素和各种各样的事物，现象序列往往是对于真理的某种歪曲。所以，在科学研究中，最有意义的不是考虑现象，而应寻求那些看起来确实能够给予人们深刻见解的原则。伽利略告诫人们，如果事实驳斥理论的话，那么事实可能是错误的。伽利略忽视或无视那些有悖于理论的事实。“牛顿风格”的核心内容是：在目前的科学水平下，世界本身还是不可解释的，科学研究所要做的最好的事情就是努力构建具有可解释性的理论，牛顿关注的是理论的可解释性，而不是世界本身的可解释性。科学理论不是为了满足常识理解而构建的，常识和直觉不足以理解科学的理论。牛顿摒弃那些无助于理论构建的常识和直觉。因此，“伽利略-牛顿风格”的核心内容是：人们应努力构建最好的理论，不要为干扰理论解释力的现象而分散精力，同时应认识到世界与常识直觉是不相一致的（吴刚，2006）。

生成语法的发展过程，处处体现着这种“伽利略-牛顿风格”。生成语法的目的是构建关于人类语言的理论，而不是描写语言的各种事实和现象（冯志伟，2009）。

语言学理论的构建需要语言事实作为其经验的明证。但是，采用经验明证的目的是为了更好地服务于理论的构建，生成语法所采用的经验明证一般是与理论的构建有关的那些经验明证。因此，生成语法研究的目的不是全面地、广泛地、客观地描写语言事实和现象，而是探索和发现那些在语言事实和现象后面掩藏着的本质和原则，从而构建具有可解释性的语言学理论。所以。在生成语法看来，收集和获得的语言客观事实材料越多，越不利于人们对于语言本质特征的抽象性的把握和洞察，而探索语言现象的可解释性，才是语言研究的目标之所在。GPT尽管功能强大，但是至今仍然是一个“黑箱”，不具有可解释性（Linzen，2019）。

乔姆斯基对于人类语言知识的本质、来源和使用问题的看法，与GPT对于非人类语言知识的本质、来源和使用问题的看法针锋相对，且GPT不具有可解释性，因此，乔姆斯基对于GPT持否定的态度，也就不足为奇了。

作者：冯志伟、张灯柯
原文：GPT与语言研究
来源：《外语电化教学》2023年第2期
综合编辑：应用语言学研习
微信公众平台审核：研习君

来源：再建巴别塔（公众号）
链接：https://mp.weixin.qq.com/s/Lzy54V6mfn5ye9Jph-q5oA

编辑：郑程程

迁移：李梦瑶

帐号		自动登录	找回密码
密码			实名注册