以LLM为代表的大模型显然暂时占据了当下AI潮流的鳌头,作为AI的新突破,其实也算属于婴儿期,那么未来会如何发展呢,不妨大胆猜测一下: 1. 大模型随着更新换代,比如ChatGPT,应该越来越聪明,减少目前的诸多缺陷,比如借助内部的外挂手段,如检索LLM的增强生成Retrieval Augmented generation-RAG等。 2. 响应速度会越来越快(如GPT-4o,响应速度达到人类级别,200-300毫秒),实时交互体验逐渐变好,加速应用的发展。 3. 多模态的LLM(文本、图像、视频、音频等),对于物理世界的多通道信息的理解与输出控制,能够使得大模型更加聪明,综合能力更强(想一下,几个瞎子摸象)。 4. 大模型的外挂时代(APP)即将到来。LLM外挂具有多种形式,小的,如各种基于LLM简单吐字的应用APP,如助理。大的,如各种利用LLM粗糙大脑的进一步精细化,应用具体化,如专业垂直模型、生产服务机器人、自动驾驶、自动系统、专业数字人等。 5. 大模型个性化及专业化,产生能够应用到个人、教育或企业业务的专用垂直模型(如医疗大模型、科研大模型、物流大模型等)。未来,大模型内也可以包括大脑+小脑(个性化+专业化)的形式,而不仅仅是改变LLM内部参数的方式,或者加外部外挂(小脑)的形式。 6. 大模型可以越来越小,从而嵌入手机、IOT物联网设备、机器人、无人机、无人船、无人车,可以采用“外脑(云端部署)+本地大脑+本地局部小脑”(如强化学习RL或传统优化控制方法MPC、甚至PID等)从而更加敏捷地控制具身智能的外挂体。 7. 大模型随着初级的百模大战,会逐步过渡到生态大战,一个可能的结果是:Token免费使用,从而从生态赚钱(互联网的搜索引擎就是一个前例)。 8. 大模型的算力恐慌未来会被新的计算技术突破,如量子计算的突破,得到缓解,并带来新的突破。 9. LLM数据恐慌问题,或许通过LLM-Agent对物理世界的社会模拟、自然模拟一定程度缓解,也就是通过Agent在虚拟世界的交互,加上(部署在物理世界的海量基于LLM的智能体)对物理世界的交互与映射,在一个基于LLM-Agent的数字孪生世界,产生机器智能体自身对于物理世界的认识、知识规律的理解,作为LLM基于人类积累的网络形式知识的学习(training)补充,而进一步产生机器自己的新的混合智能。
j5 p% `; W7 W0 D* t* _]来源:人机与认知实验室(公众号) 编辑:李佳
' q- _ E# U& _: r |