《中国经济周刊》记者 孙冰 | 北京报道
7月13日,国家网信办七部委公布了《生成式人工智能服务管理暂行办法》,并将于2023年8月15日起施行。这被认为将为我国AI大模型的加速发展,尤其是商业化落地,提供重要的制度基矗
今年5月28日,科技部新一代人工智能发展研究中心发布的数据显示,中国研发的大模型数量排名全球第二,仅次于美国,目前中国10亿参数规模以上的大模型已发布79个。
而在两个月时间里,截至目前,据记者不完全统计,又有超过20个各类AI大模型亮相。除了数量的快速增加,AI大模型还呈现出拥抱B端、发力产业落地的趋势,不仅科技公司纷纷面向不同行业场景推出基于AI大模型的产品和服务,也有不同领域的“头部玩家”基于行业特点推出各种垂直大模型。
通用还是垂直?“百模大战”正在出现分化
ChatGPT的爆火打开了AI 2.0的大门,但陷入“百模大战”的中国AI产业,正在出现分化。
中国工程院院士、阿里云创始人王坚,北京智源人工智能研究院院长黄铁军教授,创新工场董事长兼CEO李开复等多位产学研专家在接受《中国经济周刊》采访时,都表达了对AI大模型未来发展的一个共识:
通用大模型(基底大模型)在全球范围内数量都不会太多,很可能就像移动互联网时代的苹果iOS和谷歌安卓,两三家而已;而垂直大模型则会像各类APP,会形成垂直领域的头部玩家,也会产生非常丰富多样的生态体系,容纳各种体量的公司。
前者是一条非常艰难的路,需要拥有充足的技术和人才储备,要投入大量的资金和时间,还要有足够的生态构建和孵化能力。但一旦成功就是一家世界级的伟大公司;后者相对确定性更大,也有更多、更丰富的可能性,但体量和想象空间可能与前者无法相比。
如果AI产业的发展确实就按此逻辑和格局发展,那当下火热的“百模大战”一定会出现分化,而实际上,这种分化已经在发生。尤其是Meta还抛出了一颗重磅炸弹,甚至有媒体将其形容为全球AI大模型产业“一夜变天”。
7月19日,Facebook母公司Meta正式发布Llama2模型系列,最高达参数量700亿,而是全部开源,且免费、可商用。这意味着各行各业各种体量级别的公司都可以基于开源的基底大模型,开发适配自身行业业务场景和需求的大模型。
猎豹移动董事长兼CEO、猎户星空董事长傅盛就在微信朋友圈转发了这条信息,并感慨不知道有多少公司会笑醒在深夜,又有多少公司要哭晕在厕所。
但一位在人工智能领域深耕多年的投资人告诉《中国经济周刊》:“Open AI一开始也Open,但微软入股后,GPT4之后就不给免费用了;Llama 2现在开源且免费,但最先进的技术也不一定会给人用。所以,大家确实不用重复造轮子了,但只有最基本、最普通的轮子可以用。而且中国公司还要考虑是否能一直用美国轮子的问题。”
王坚告诉《中国经济周刊》记者,AI大模型发展过程中出现一哄而上,或者说有些泡沫也不是什么坏事情,这意味着大家对于这个事情有热情,不要打击这一点。
“但我们真正要警惕的是不要出现一哄而下。现在大模型的商业问题没有解决,如果大家对于这件事情没有充分的认知,研讨的深度也不够,就可能出现一旦发展中间有波折,尤其是有资本驱动的话,就发生一哄而下的情况。”王坚表示。
不聊天不写诗去做事,离产业近就是离钱近?
除了做通用还是做垂直,to C还是to B也是AI大模型发展的重要方向选择。
由于ChatGPT先是在C端产生了巨大传播力和影响力,所以百度的文心一言、阿里的通义千问、科大讯飞的星火认知等也都是先以聊天、写诗、作画的方式亮相,随后也都很快推出了面向B端的行业解决方案。而华为、腾讯、京东、360等则直接杀向B端,将大模型的重心放在行业落地上,并开始进入商业化探索阶段,向“钱”进。
腾讯云智能大模型产品负责人侯方告诉《中国经济周刊》记者,腾讯非常看好大模型技术的发展,通用大模型和垂直大模型两个方向都会关注。但通用大模型的落地可能会面临比较高的门槛,算法、算力、数据都存在成本高、周期长、有限制等难题。而大模型在垂直化、场景化的方向上则会落地更快,因此,腾讯会与不同行业的合作伙伴合作,去挖掘AI大模型的产业机会。
腾讯副总裁、腾讯政企业务总裁李强也曾对外表示,通用大模型不是模型应用的唯一方向,面向垂直产业的模型会成为大模型价值的“引爆点”。
侯方透露,虽然AI大模型技术的火爆是因为ChatGPT的出现才被大众所感知,但是对于腾讯来说,其实很早就在做相关技术积累和探索。“从基础复杂度和技术难度来讲,是很难在短时间内突击实现的,AI能力需要一层一层地向上构建。”侯方表示。
这其实也能解释,为什么目前AI大模型的“头部玩家”大部分是头部云厂商。
侯方以腾讯为例,过去云厂商对外主要提供三种服务形态,即IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)。AI大模型快速发展之后,现在还会再加上一层MaaS(模型即服务)。
“单点的AI能力很难直接成为一种服务提供的方式,需要把整个路径打通,才能让大模型带来比较好的赋能。”侯方解释说。比如,智能客服、对话助手、数字人等过去也有,但加入AI大模型的能力之后,可以让这些应用拥有更高的效率性能和更好的服务体验,同时有更低的应用门槛和使用成本。
“所有热潮最后都会回归实操,冷静过后,大家要讨论的还是什么问题适合用大模型去解决。大模型尽管是一个非常大的技术创新,但技术创新最终还是要与场景结合,这是一个非常关键的点。”侯方说。
比如自从ChatGPT问世以来,大家惊叹于其巨大的参数量和其产生的智能涌现。于是,人们看待大模型,会首先开始进行参数量的比较。但侯方认为,就大模型本身而言,并不是说参数越大越好,最重要的是要看你要解决什么问题。“在不同问题场景下,你可能需要一个更大型、更全面的模型,也可能只需要一个很小但更专业、更聚焦的模型。”他说。
侯方还强调,AI大模型的生态建设也是一个非常重要的方面。因为随着更多开源模型的出现,AI大模型对算法的门槛会变低。但基于算法去做一系列工程化的开发就会变得很重要。
“未来,围绕AI大模型整个生态,一定会涌现出一大批新的应用开发者,毕竟AI2.0时代,所有的应用层全部可以重新颠覆一遍。腾讯希望做的是围绕大模型的上下游和各路合作伙伴,一起探索和共建,为他们提供配套服务和支持体系。”侯方表示。
责编:郭霁瑶
(版权属《中国经济周刊》杂志社所有,任何媒体、 网站或个人未经授权不得转载、摘编、链接、转贴或以其他方式使用。)
公众号:小姨ai
暂无评论内容