大模型LLM的未来发展

刘海明 · 发表于 2024-7-4 21:13:26

以LLM为代表的大模型显然暂时占据了当下AI潮流的鳌头，作为AI的新突破，其实也算属于婴儿期，那么未来会如何发展呢，不妨大胆猜测一下：

1. 大模型随着更新换代，比如ChatGPT，应该越来越聪明，减少目前的诸多缺陷，比如借助内部的外挂手段，如检索LLM的增强生成Retrieval Augmented generation-RAG等。

2. 响应速度会越来越快（如GPT-4o，响应速度达到人类级别，200-300毫秒），实时交互体验逐渐变好，加速应用的发展。

3. 多模态的LLM（文本、图像、视频、音频等），对于物理世界的多通道信息的理解与输出控制，能够使得大模型更加聪明，综合能力更强（想一下，几个瞎子摸象）。

4. 大模型的外挂时代（APP）即将到来。LLM外挂具有多种形式，小的，如各种基于LLM简单吐字的应用APP，如助理。大的，如各种利用LLM粗糙大脑的进一步精细化，应用具体化，如专业垂直模型、生产服务机器人、自动驾驶、自动系统、专业数字人等。

5. 大模型个性化及专业化，产生能够应用到个人、教育或企业业务的专用垂直模型（如医疗大模型、科研大模型、物流大模型等）。未来，大模型内也可以包括大脑+小脑（个性化+专业化）的形式，而不仅仅是改变LLM内部参数的方式，或者加外部外挂（小脑）的形式。

6. 大模型可以越来越小，从而嵌入手机、IOT物联网设备、机器人、无人机、无人船、无人车，可以采用“外脑（云端部署）+本地大脑+本地局部小脑”（如强化学习RL或传统优化控制方法MPC、甚至PID等）从而更加敏捷地控制具身智能的外挂体。

7. 大模型随着初级的百模大战，会逐步过渡到生态大战，一个可能的结果是：Token免费使用，从而从生态赚钱（互联网的搜索引擎就是一个前例）。

8. 大模型的算力恐慌未来会被新的计算技术突破，如量子计算的突破，得到缓解，并带来新的突破。

9. LLM数据恐慌问题，或许通过LLM-Agent对物理世界的社会模拟、自然模拟一定程度缓解，也就是通过Agent在虚拟世界的交互，加上（部署在物理世界的海量基于LLM的智能体）对物理世界的交互与映射，在一个基于LLM-Agent的数字孪生世界，产生机器智能体自身对于物理世界的认识、知识规律的理解，作为LLM基于人类积累的网络形式知识的学习（training）补充，而进一步产生机器自己的新的混合智能。

本文来自罗汉江科学网博客。
链接地址：https://blog.sciencenet.cn/blog-451666-1440853.html

]来源：人机与认知实验室（公众号）

编辑：李佳

链接：https://mp.weixin.qq.com/s/DeZNN2tkvoY1sQr-q3oYow

帐号		自动登录	找回密码
密码			实名注册