以下是论坛的精彩观点:
1.从模型层面来讲,我的观点是未来一定是从语言模型开始往多模态延伸,让模型学到更多对这个世界的知识,对这个世界有更深的理解。
2.大模型是走向通用人工智能的一步,可以说是往前迈了一大步,但大模型不等同于通用人工智能。目前为止,我们可能还在奋起往前迈进的阶段,最后如何到达通用人工智能还有很多未知。
3.之前有一个观点,现在各行各业都可以用大模型重做一遍。这个“重做一遍”不是说推倒重来,而是大模型确实可以给业务的效率和效果带来很大的提升。
4.大模型时代,对企业来说比较重要的问题是,自己内部的数据有没有做很好的积累和Organize,然后才是大模型厂商开源模型有没有进行好的结合。
5.所有技术的发展一定会遵循Gartner曲线,现在是上升期,往后会下探,这个过程是跑不掉的,最后终局通用的大模型应该只有几家,不会太多。不管是AI In Digital还是AI In Physical,垂类模型在中国大有空间,未来会是百花齐放的局面。
以下为本场圆桌论坛对话实录(有删减):
大模型还有哪些发展趋势
郑烜乐:今年年会的主题是“涌现”,随着ChatGPT的横空出世,“涌现”这个词变得非常不平凡,大模型研究过程中发现一个现象,当模型增长到某个规模,会忽然获得某种解决复杂问题的能力,这就是涌现。涌现能力的出现,同时也指代着AI忽然能够解决更多产业问题和企业发展问题,解决更多社会上各种各样的需求和能力指数级的提升。
请问,未来大模型还可能出现哪些技术趋势?大家更看好怎样的技术路线?当前以OpenAI为代表的美国企业在全球大模型技术上是领先的,我们应该如何提前做准备、做投入、做布局,加快缩小之间的技术差距?我们在追赶的过程中又能够抓到哪些创新机会?
李大海:首先,从技术层面来讲,大语言模型开启了一个新的技术范式,就是用结构足够简单但规模足够大的模型,去学习足够多的数据和知识,把这些知识压缩到一个模型。这是这个范式最核心的点,在这个逻辑下,最重要的事情就是学到知识的多少。
但根据实践,当前Transformer看起来已经是比较优的架构,要在上面做改良,目前还没看到特别巨大的提升空间,更重要的是更多的数据。因此从模型层面来讲,我的观点是未来一定是从语言模型开始往多模态延伸,让模型学到更多对这个世界的知识,对这个世界有更深的理解。
其次,就是多体智能。模型本身的单体能力足够强,以后就像人一样,能够具备很强的能力,但人类社会是不同的角色、不同的专家在一起协作产生的。未来AI有不同的角色分配以后,协作产生的工作应该会有智能层级的提升。
面壁智能联合清华大学,最近刚启动了一项工作,是一家虚拟的软件公司。这个软件公司里所有的角色都是AI,包括虚拟的CEO、产品经理、工程师和QA质量检测。我们给这个软件公司下了一个任务,要求他们做一个五子棋的软件,一般执行力很强的公司需要两到三周的时间把软件写出来,这家AI公司一共用了七分钟。当AI能力变强以后,未来怎么把多体智能做出来,如何用多体智能协同产生更好的工作也是一个很重要的方向。
这三个“G”可以让大家产生无穷的想象力,回归到金融行业,AI本身的发展离不开数据,金融行业是最早应用AI的垂直领域,因为金融科技行业天生就有大量的交易数据。
ChatGPT热潮之前,我们一直在应用各种各样人工智能技术。这些技术主要分为两类:一类是底线类的应用,Guardrail,就是怎样用人工智能技术作为一个护栏为你的业务保驾护航,反洗钱、合规等领域都会大量应用人工智能技术。另一类是顶线类应用,就是给你带来更多的生意和业务。因此在金融领域AI有非常广泛的应用。
黄飞燕:ChatGPT火了差不多三个月,而我们公司在这三个月里经历了痛苦的转型。我们公司只有600多人,但要服务上千万的客户。我们的AI应用从三个月前就正式开始了,三个月内应用到内部、应用到客户的身上。可以想象未来还有大量的工作要把AI应用结合整个行业,让客户得实惠,以及自己的员工要通过AI应用大幅度提升工作的效能。更重要的是每一位员工都要意识到新的时代来临,员工必须跟上整个时代节奏的变化和发展,让我们公司走在整个行业前面。
对内,以前我们的HR工作蛮辛苦的,600个员工,每一位员工都要由HR一对一沟通,现在我们就使用AIHR的小工具,AIHR会自动告诉每一位员工应该怎么处理。
对外,面向客户员工的个人服务,我们已经通过AI应用进行了三个层次的服务。第一层,相对应用的稍微深一些,企业员工的体检,体检说起来好像很简单,但每个人根据自己的身体情况、特点、曾经做过的报告、家庭史,到底应该做什么体检是最适合的,可以通过AI去做这件事。体检报告出来后,以前的解读很被动,一位医生一天下来只能解读70份体检报告,现在我们把体检报告的解读人工智能化,深度应用到客户身上。
第二层,这是和大模型公司联合开发的。体检后发现问题,比如很多人都有肺结节,其实可以通过AI影像分析和跟踪手段,告诉他这个结节什么情况,下一步应该怎么办。现在我们对于结节、超重、肥胖的管理,以及影响心脑血管的风险管理都增加了AI手段。
下一步针对风险管理,我们发现完全可以AI化。如果说AI应用有三层,第一层在应用,第二层正在开发中,第三层正在进展中,我们自己公司会彻头彻尾拥抱AI。
郑烜乐:作为大模型公司,对商业化有什么针对to C和to B方向的思考?比如在行业应用和企业数字化方面,大模型厂商能够发挥什么作用?
李大海:之前有一个观点,现在各行各业都可以用大模型重做一遍。这个“重做一遍”不是说推倒重来,而是大模型确实可以给业务的效率和效果带来很大的提升。效率是成本,效果是质量,这二者都会有显著的变化。我想站在企业家的视角提出一个新的观点,大语言模型其实是AI范式带来的一个巨大的变化,让我们的数字化能够落地。
数字化这件事情已经做了很多年,能够让企业家看到企业真实的经营情况和很多过程,但其实还不够。有了大语言模型以后,我们可以看到数字化出来的成果,我们的数据真的变成了非常重要的生产资料。
刚才讲到智能客服,每个面向C端的产品都需要有很多客服,这些客服跟用户交互的回复。这包括背后的知识,都是和企业的生产流程、业务逻辑非常耦合的,而这是任何一个大语言模型通过通用知识解决不了的问题。
比如,美团遇到一个外卖的客户要退单,这个退单是因为什么?如果是商家的原因,可能退单的成本是需要商家支付。这些业务逻辑都是企业内部积攒了大量的数据,根据这些数据再去和大模型结合,才能产生好的效果。如果过去数字化的过程中有意识的积累,跟大模型结合的时候效率也会比较高。
大模型时代,对企业来说比较重要的问题是,自己内部的数据有没有做很好的积累和Organize,然后才是大模型厂商开源模型有没有进行好的结合。
付英波:我从行业宏观维度说一说自己的看法。我们认为大模型的应用基本上可以分为两条路径:一个叫做AI In Digital,整个数字空间大模型如何能够最大化地学习和吸收这些知识,变成一个涌现的智能体,把整个数字空间里面的场景重做一遍或者加强一遍。这个领域目前结合度比较快的,或者是链条比较短的,我个人比较看好搜索和娱乐这两个行业,因为这些数字领域的知识重构、知识获取链条是最短的,也是价值闭环实现最快的。
第二,AI In Physical,也就是在整个物理空间、物理世界,大模型如何把物理信息和知识吸取、学习,并且出现涌现的能力,可能物理空间更多考验的不单单是语言模型,更多的是偏多模态的模型。如何把这些模型通过合适的硬件载体,不管是机器人还是芯片,能够在我们整个物理空间中发挥作用,实现整个物理空间的智能化和智能体的跃进。
这两个领域里,我分别举两个企业的例子,它们做得非常成功。在整个数字空间里,现在杀手级的应用就是OpenAI的ChatGPT,微软和Google这样的巨头公司也在尝试把大模型的能力往自己的数字空间产品里做增强,包括微软的一系列对办公系统的重构。物理空间方面,我感觉做得不错的是以特斯拉为代表的一些泛智能设备公司,这些公司未来将运用大模型的能力在物理空间里,通过智能车或机器人这样的载体,极大地改变行业。
郑烜乐:余总,你觉得大模型对整个行业的改变,包括金融科技这个行业的改变,会在哪些层面影响商业范式?什么样的企业在这个过程中能变得越来越强大?什么样的企业可能会被拍死在沙滩上?
余晨:最近几年最吸引大家眼球的有两项技术:一项是AI,一项是Web3.0。AI出来以后,很多人觉得Web3.0凉了,而Web3.0本来就是很有争议的技术,这是基于区块链的去中心化的机制。长远来讲,二者是有结合点的,我们训练AI的数据是不是能够用Web3.0通证化产生激励机制,确保数据来源的可靠性,就是去中心化的训练。反过来,未来是不是可以把AI服务通证化?不管是现在通过API、通过订阅还是通过SaaS,未来可以用通证化的方式让大家访问这些AI服务,这些都可以带来新的商业模式。
为什么AI和Web3.0最能够对商业产生影响?可以把AI想成生产力的提升,Web3.0是生产关系的改变和重构。按照最激进的想法,有了Web3.0以后,未来我们甚至不需要公司,就是用去中心化自治组织的方式让自由人自由联合,能够在AI之间协调,通过通证的方式产生价值的传递和媒介,能够给我们带来全新的商业模式。不管是生产力还是生产关系的层面,长远来看,这是一个非常激动人心和有意义的方向。
AI带来的商业范式革命
郑烜乐:AI代表生产力革命和更先进的组织形式结合,可能带来生产力的进一步飞跃。如果是人组成的公司,将来效率上拼不过AI组成的公司,商业范式可能发生什么革命和变化?
李大海:对未来,大家不可能有准确的回答。这其中主要有两个方向的变化:一个是多极智能,AI带来的强大能力会让生产关系发生巨大的变化。未来一个非常有想法的人自己就可以开一家公司,员工大部分都是AI员工,少部分的人员需要学习摸索怎么和AI员工一起合作产生商业上的价值,社会会越来越扁平。
另外一个可能性,现在的AI都是Data-centric,是以数据为中心的AI,很容易产生数据飞轮:拥有一个很好的场景,然后积攒足够多的数据,有了足够多的数据后,通过AI让这个企业变得更好,从而有更多的用户进来,产生更多的数据。未来掌握足够多数据的公司会掌握足够多的生产资料,能够产生足够强的壁垒。以上两个趋势,其实有点互相背离,哪个趋势未来能够变成主流我也没有想清楚,但我觉得还是挺值得期待的。
黄飞燕:1995年我刚好在美国读书,经历了当时的互联网变革时期,这20年不会用互联网或者用互联网慢的企业和个人要么已经被“拍死”,要么也快了。今天AI大潮下,我感觉也是一样的。这种东西谁先用谁就会比别人用得更熟悉、更顺手、更有帮助,无论对自己还是对客户,就会引来更多的应用。无论是背后数据应用得更好、功能应用得更好还是模式应用得更好,谁先用熟了就走到前沿。
付英波:我就讲三点关于自己对大模型未来发展的思考和想法。
我赞同刚才各位嘉宾的讲法,大模型这项新技术或者未来要迎来的通用人工智能时代,在座的有很多都是企业家,也有各行各业的从业者,我们还是要积极拥抱。因为这波大趋势一定会来临,而且可能会来得很快,就像过往的几次生产力大幅度提升的革命一样,包括电气、信息和智能,这是不可避免的。不管我们所在什么行业,需要积极拥抱这些技术,利用这些技术更好地为我们所在的企业、行业和实体创造价值。未来特别是大模型起来以后,可能有四个因素是大家要重点思考和重点把握的。
一是基础科研以及人才密度,大模型和七年前的人工智能没有本质的变化,就是深度学习浪潮的延续。目前企业做这一块的有多少懂深度学习的优秀研究员,算法能力和人才密度非常关键,如果没有人才密度的话,最重要的环节就会有比较大的欠缺。二是数据。数据是驱动大模型往下发展最重要的能源和原料。三是场景。我们现有的数据是有限的,需要持续有固定的场景帮助你产生新鲜的数据,不断进行模型的迭代。四是算力。因为目前算力在国内其实还是挺紧张的,不管是大模型的基础研究还是大模型的行业应用,必须面对的就是这四道坎或者四个必须的要素。
大模型经过半年如火如荼的发展,现在有一个说法叫做“百模大战”,越来越多的模型推出,我认为这在前期是一个好事。所有技术的发展一定会遵循Gartner曲线,现在是上升期,往后会下探,这个过程是跑不掉的,最后终局通用的大模型应该只有几家,不会太多。不管是AI In Digital还是AI In Physical,垂类模型在中国大有空间,未来会是百花齐放的局面。
郑烜乐:我们去年下半年做AIGC,今年年初开始做大模型,到现在组建专门的AI团队,甚至也请到大模型的工程师加入我们的团队。现在我们越发感觉到这是第四次工业革命,AI从一个技术变成了一个基础设施和巨大的生产力提升的要素,开始影响各行各业。现在AI投资还在早期,越来越多的人才、资金、产业的合作方等各种各样的生产要素向这个行业快速集中,其实这是一个非常大的历史变革。
最近几年,国内外流行一个非常前沿的思想叫做有效加速,就是新技术更好地普惠和正向引导,作用于生产、生活和社会,方方面面推动这些发展和社会的进步。其实AI是给了企业家、科学家、产业界这样的力量,让大家能够去用科学技术、用前沿的各种各样的新范式、新技术、新能力做更多的、更有价值的事情,产生更多的社会价值。