当OpenAI不Open,国产大模型何以自强?

南方+

本文收录于专辑#南方读+#

两年前,OpenAI的聊天机器人ChatGPT横空出世。短短两个月内,其月活用户就突破1亿,成为史上用户增长速度最快的消费级应用。它的出现,也将大模型带入公众视野,科技巨头争相入场,拉开“百模大战”序幕。

然而,就在上个月,OpenAI突然发布一封“警告信”,宣布7月9日起终止对包括中国大陆在内的地区提供API服务。这意味着许多高度依赖OpenAI技术的企业,特别是以其为基础进行“套壳”创业的公司,无法再正常使用它的服务。

当OpenAI不再Open,我们该怎么办?

越来越封闭的OpenAI

OpenAI突然的“断供”,无疑给了不少企业当头一棒。

但这一举动,似乎也在意料之中。

实际上,OpenAI官方此前就不向中国境内直接开放注册和使用,国内开发者和企业主要通过微软的Azure云服务等渠道,间接使用OpenAI的技术支持,只不过对此,OpenAI此前是睁一只眼闭一只眼。而这次,它直接将枪口瞄准了这一部分账号。

所谓API,就是预先定义好的规则和接口,允许不同软件系统或组件之间相互通信。打个比方,API正如餐厅的菜单,顾客(相当于使用API的程序)不需要知道厨房(相当于提供服务的系统)是怎么运作的,只需根据菜单(API)上提供的菜品(功能和数据)点单,厨房就会按照规定流程把菜做好并端出来。最常见便是手机的天气应用,通过调用数据提供商的API,为用户提供最新天气。

早在ChatGPT 4.0发布后不久,OpenAI就已经在间歇性封禁部分来自受限制区域的账号,只不过对于通过服务器跳转等方式访问的API流量,OpenAI则是睁一只眼闭一只眼。而这次,它直接将枪口瞄准了这一部分账号。

OpenAI通知邮件截图

OpenAI通知邮件截图

越发封闭背后,原因众说纷纭。但光是OpenAI产品本身,一直就有不小的争议。

首先,“技术黑箱”质疑。OpenAI的技术细节和算法往往不完全公开,外界难以了解其原理和机制。这种“黑箱”操作,引发公众对透明度的强烈质疑。

其次,知识产权争议。OpenAI在训练大模型过程中,大量使用第三方数据,如何确保其使用不侵犯他人权益,甚为复杂。在媒体行业,就有美国知名记者因OpenAI“盗用作品”,将其告上法庭。

再者,技术滥用。尽管OpenAI的目标是推动人工智能技术的发展,但其技术或许正被滥用。例如,生成虚假信息、进行网络攻击或用于不当的炒作等。

最后,市场垄断。OpenAI形成的垄断,不仅会限制其他企业的发展空间,还可能影响行业创新。特别是苹果宣布iOS18接入ChatGPT,进一步增强其垄断地位。为此,马斯克宣布员工不能带苹果手机进入办公室,还称OpenAI为“CloseAI”。

“他横由他横,明月照大江”

OpenAI的限制当然不会是“世界末日”。危与机向来都是并存的。

首先,如今大模型的市场已经足够庞大,OpenAI不是唯一的选择。北京时间7月23日晚,Meta发布全新开源模型Llama 3.1,Meta创始人CEO扎克伯格称其“将成为行业的一个转折点”。

其次,OpenAI的这一行动也可能成为推动中国AI产业自主创新的契机,促使国内企业加大自主研发力度,减少对外部的依赖。

行业内部加速洗牌,一些依赖OpenAI进行“套壳”开发的企业被淘汰,那些具备自主研发能力或能快速适应变化的企业则可以脱颖而出。从而完成一次“优胜劣汰”。

在OpenAI宣布“断供”之后,许多国产大模型纷纷推出“搬家计划”,准备接住这一“泼天富贵”。

BAT率先“出招”。百度智能云千帆宣布推出大模型普惠计划,支持零成本切换至其大模型平台。阿里云则宣布,通义千问为中国开发者提供2200万免费Tokens和专属迁移服务;腾讯云宣布为新迁移企业用户免费赠送1亿腾讯混元大模型tokens(标记),并提供免费专属迁移工具和服务。

此外,智谱、零一万物、百川智能、月之暗面等也纷纷加入。

正如360集团创始人、董事长周鸿祎所说,“停服”未必是一个坏事。“OpenAI的API无法调用,这逼着国内应用只能选择国产大模型,而国产大模型与GPT的差距已经逐渐缩小了。”

第二十届中国(深圳)国际文化产业博览交易会大模型展区。南方+记者 张令 摄

第二十届中国(深圳)国际文化产业博览交易会大模型展区。南方+记者 张令 摄

中国AI的追赶之路

战略性新兴产业和未来产业,是形成新质生产力的主阵地。我国“十四五”规划提出,要在类脑智能、量子信息、基因技术、未来网络、深海空天开发、氢能与储能等前沿科技和产业变革领域,组织实施未来产业孵化与加速计划,谋划布局一批未来产业。

为此,我国积极推动AI大模型发展,工信部提出加快培育面向工业领域的大模型,上海和深圳等地也发布相关政策,支持技术创新和应用。

科技部的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,仅次于美国;从区域分布来看,北京、广东、浙江、上海处于第一梯队。根据报告数据,中国10亿参数规模以上的大模型已发布79个,主要集中在北京和广东,其中北京38个大模型,广东20个大模型。

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议在上海开幕。工作人员在展示手势控制机器人操作流程。新华社记者 黄晓勇 摄

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议在上海开幕。工作人员在展示手势控制机器人操作流程。新华社记者 黄晓勇 摄

前不久,联合国世界知识产权组织(WIPO)发布的报告《生成式AI专利态势报告》显示,中国在生成式人工智能领域的专利申请量居世界第一。2014年至2023年,中国生成式AI专利申请量达38210项,是第二名美国(6300项)的6倍,韩国和日本则以4155项和3409项位列第三和第四。

从专利申请机构来看,全球排名前十的专利申请机构中,有6家来自中国。其中,腾讯以2074项发明位列第一,平安保险以1564项位居第二,百度以1234项排名第三,中国科学院以607项排名第四。此外,阿里巴巴、字节跳动等也进入了全球前十。

尽管美国在芯片、算法等核心技术方面,仍占据主导地位,上述榜单反映出中国在该领域的巨大创新潜力。

在具体应用方面,目前微博、小红书、今日头条等国内头部产品,纷纷推出自家的大模型,支持一键优化内容发布,海量的用户应用,不断推动产品迭代。快手的文生视频大模型可灵,效果不输美国的Sora,并且率先实现向普通用户开放。

前有英伟达在硬件芯片上做“阉割”,后有OpenAI在软件算法上搞“停服”,明面上是修护城河,实际上在建隔离墙。面对AI领域的堵截,我们唯有瞄准方向,强化自研定力,加强全球合作,再宽的护城河,也总能蹚过去。

【撰文】话题研究员 尤立川 陈明诗

【策划】纪蓓 何勇荣

编辑 魏伯航
校对 王睿
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开