在即将画上句号的2023年,人工智能(AI)大模型步入聚光灯下,成为科创圈前所未有的“顶流”。在这场新技术浪潮下,从初创黑马到龙头企业,从传统行业到科技行业,都站在了新起点之上,共同拥抱这场以人工智能为轴、向千行百业辐射扩散的变革浪潮。
年初,当人们谈及大模型时,话题还停留在“人工智能大模型是什么”,数月间,大模型早已从饭后谈资走向实战,并从早期的性能参数比拼步入落地应用竞跑的新阶段。
“百模之战”加速席卷
“机会就在现在,AI 2.0的机遇比移动互联网来得更凶猛。”12月14日,以零一万物CEO这一新身份亮相的李开复在量子位主办的MEET2024智能未来大会上说。今年夏天,李开复筹建零一万物——一个打造“AI 2.0”新平台和AI驱动生产力应用的全球化公司。上个月,这家由创新工厂集结顶尖资源以“塔尖孵化”模式孵化出的企业发布了支持全球最长上下文窗口的预训练模型。
今年以来,无论是披挂上阵创业的创新工场董事长李开复、前搜狗公司CEO王小川、京东前任技术掌门人周伯文等领军人物,还是百度、阿里、华为、美团等互联网科技巨头,或是智谱AI、面壁智能、月之暗面等初创“黑马”,创投圈频频引发外界关注甚至收获巨额融资的高光时刻,不少都与人工智能大模型紧密相关。
为抢抓技术与产业变革机遇,各地政府也纷纷发力,为大模型创新提供加速度。据不完全统计,北京、上海、广东、安徽等地均已发布相关政策,从算力支持、场景开放、技术突破、产品生态等多方面鼓励大模型应用落地。数据显示,截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所已达254家,遍布20余个省市区。
“超级应用”正在路上
如果说过去一年经历的大模型“上半场”拼的是参数、性能,在大模型“下半场”,落地应用无疑将成为各家比拼争抢的重点。在李开复看来,当下巨大体量预训练模型的窗口期正逐渐关闭,但AI应用的机会才刚刚开始。
随着大模型陆续在一些行业探索落地,自动驾驶大脑、高智能语音助手、智能员工、智能科研助理等被大模型赋能后的新场景、新应用不断涌现。但时至今日,仍然未出现像微信、支付宝、抖音这样的“超级应用”。
大模型时代的“超级应用”,究竟会从何处崛起?在近日发布的《2023年度十大前沿科技趋势报告》中,十大趋势中与AI技术相关的趋势数量达到4个,AI智能体位列首位。
所谓AI智能体(Agent),是帮助AI与外界进行交互、感知外部信息、对外提供服务的部分程序或者运行程序的某个实体,如智能机器人或智能传感器等。漫威电影《钢铁侠》中主人公几乎无所不能的AI助手贾维斯,正是科幻作品中超前展现给人类的一种AI智能体。
今年上半年,在斯坦福大学和谷歌研究院研发的“虚拟AI小镇”内,15个身份各异的智能体居民自由进行社会交往,这个虚拟AI小镇也成为了全球AI智能体探索的里程碑事件。
随着大模型进入落地应用的比拼阶段,探索合理的商业模式也成为业界关注重点。“AI大模型的付费模式只是过渡阶段,最终将是免费模式。”昆仑万维董事长兼CEO方汉认为,随着技术迭代、内容革命和端侧推理的实现,AI大模型最终会像普及后的互联网一样真正实现免费模式,也只有实现了免费模式,大模型的消费级应用才会迎来真正的大爆发。
百川智能CEO王小川表示,前期可以通过在法律、医疗、教育等高价值场景切入,解决大模型“赚钱”问题。而成本最终会通过硬件升级或软件迭代而大幅下降,技术进步终将会填平这些困难。王小川表示,他坚信明年中国会有若干款超级应用产生。
算力“堵点”仍待补齐
值得留意的是,在这场全球范围内的大模型浪潮下,中国的参赛选手们并非一路无虞。
中国工程院院士、清华大学计算机系教授郑纬民提醒,整体而言,我国算力基础设施规模已位居世界前列,但人均算力尚低。“大模型是新型基础设施的关键底座之一,大模型的竞争也是国家科技战略的竞争,中国一定要布局全栈自主创新的大模型产品,必须要构建国产化算力。”
算力紧缺,已成为制约我国大模型产业发展的“堵点”之一。
vivo副总裁、vivo AI全球研究院院长周围14日在智能未来大会期间坦言,国内AI公司面临较大的算力问题,很多规划中的产品都(因算力紧缺)延期交付。实际上,因大模型引发的算力需求暴涨、高端算力依赖进口而引发的算力紧缺已在行业内持续数月。“未来9到12个月,算力还是会非常紧张。”百川智能技术联合创始人陈炜鹏在2个多月前在一场行业论坛中如是说。
11月中旬,算力租赁概念股汇纳科技宣布,由于算力需求大幅增加,算力资源持续紧张,其内嵌英伟达A100芯片的高性能服务器算力服务收费将上调100%。这只是我国“算力之渴”的冰山一角。多家券商在上个月发布研报提出,随着行业供求矛盾升级,算力租赁行业将进入新一轮涨价周期。
在中国工程院院士邬贺铨看来,大模型参数呈现大幅增长的态势,牵引训练数据量和GPU需求“水涨船高”,基于算力需求、数据隐私、处理效率等考虑,未来需要将计算能力在云、边和终端之间合理分配,AI服务器、边缘AI芯片将迎来广阔发展前景。
郑纬民表示,目前国外厂商如英伟达等在芯片生产上有着更多的话语权,国内则因起步较晚,在自研芯片性能上仍稍显不足。但性能上的差距可以在生态上得到弥补。所谓好的生态就是让芯片用起来不费劲,建立这样的生态,并让市场接受,需要一个过程。“国产生态只要解决好编程框架、并行加速、调度器、内存分配系统、容错系统、存储系统等问题,即使只有国外芯片60%的性能,国产芯片也会大受欢迎。”他说。