拥抱DeepSeek:政企批量应用AI新工具的机遇与风险

南都即时
+订阅

春节期间,大型语言模型DeepSeek“横空出世”,彻底引爆全球科技圈。围绕80后创始人梁文锋及“发布的开源模型撼动美国人工智能巨头”等方面的话题不断。个人用户们涌入DeepSeek,算命、谈人生、改论文,甚至买彩票,热闹非凡。

全民AI热潮之下,各地公安交警、文旅部门等一大批政务账号“对话”DeepSeek,获取宣传素材,“DeepSeek是懂XX的”“DeepSeek眼中的XX”等推送刷屏。有政务号运营人员告诉南都、N视频记者,“DeepSeek确实在文案制作上有一定助力。”

2月以来,科技、汽车、手机、医药等领域头部企业密集宣布接入DeepSeek模型。随着各行各业在技术层面深度集成,DeepSeek真正走进了实际的应用场景。目前部分车型、手机AI助理以及QQ音乐、飞书等软件上都可以调用DeepSeek。在未来规划上,有企业宣布将自研大模型与DeepSeek结合,也有企业称正内测将满血版DeepSeek内嵌至产品系统。

如何看待DeepSeek的应用热潮?有业内人士分析称,“在同等算力下,DeepSeek实现了更高的推理效率,可最大程度节约企业成本投入。”在现象级爆火的背后,DeepSeek也被曝出“遭网络攻击”“仿冒网站和钓鱼网站快速增加”,DeepSeek大模型自身安全问题由此也备受关注。

大批官方账号联动DeepSeek

春节期间,一批官号开始使用DeepSeek进行文旅宣传,其中不乏阅读量超10万的推送文章。

1月28日,“南京发布”公众号推送了题为《DeepSeek还是懂南京的》的文章,文中涉及“DeepSeek眼中的南京”、南京年味、年货老字号、非遗项目、特色美食、春节好去处等内容。这一联动引来众多网友点赞,“小编你是懂流量的”。

2月1日,DeepSeek创始人梁文锋的家乡湛江也发文“蹭”热度,“湛江发布”公众号推送了《DeepSeek带你玩转湛江》的文章,吸引游客春节期间前来游玩。同日,“西安发布”公众号也“对话”DeepSeek,发布题为《DeepSeek是真懂西安啊》的文章。

随后,潍坊、成都、广州、北京、龙江等多地宣传部门或文旅部门的官方账号,也发布了类似的文章,主要内容是介绍当地代表性美食、推荐游玩景点、让DeepSeek写一首诗赋等。“DeepSeek是懂XX的”刷屏,成为文旅宣传的潮流热点。话题“DeepSeek眼中的莲都”阅读量超320万,“跟着DeepSeek游浙江”阅读量超50万。

2月7日,陕西省文化与旅游厅官方账号“陕西文旅”发布了一则视频,主题为“DeepSeek眼中的陕西”,DeepSeek创作了一首描绘人文陕西美景的古诗词《陕西行》,引来不少网友围观。

12日,“陕西文旅”的账号运营工作人员告诉南都记者,“我们前期也是用DeepSeek去做了一些文案方面的尝试,发现给出的答案比想象中的更智能化一些,效率也高,确实在文案制作上有一定助力。”

南都记者还注意到,“重庆文旅”“武汉文旅”等官方账号录制了“对话”DeepSeek的视频,当提问“出一句话就能让大家记住我”“做一个百万点赞短视频”,DeepSeek回复“服务器繁忙,请稍后再试”,这样活泼反差的互动效果也获得不错的传播量。

除了文旅宣传,南都记者梳理发现,共青团中央、公安部、检察院、应急管理厅等官方账号也根据自身业务向DeepSeek提问,基于对话素材生成宣传推文。

如共青团中央发布了《当我问DeepSeek,当兵的意义是什么》;公安部网安局发布了《当DeepSeek碰上“骗子”,看它如何应对!》;湖南省人民政府办公厅向DeepSeek提问:在外湘商回湖南投资是种什么体验;广东省应急管理厅发布《问过了,DeepSeek是懂广东应急的》;云南景洪市人民检察院用DeepSeek写了一段介绍检察官的短视频文案等。

此外,广东鹤山市、嘉峪关市、烟台市、长治市、汉中市等多地公安局,云南省、贵阳市、肇庆市、沧州市、乌鲁木齐市等地交警的一大批官方账号也利用DeepSeek,发布反诈科普、如何拒绝酒驾、出行安全提醒等内容。“当宣传民警让DeepSeek做一个反诈视频”“当公安宣传民警求助DeepSeek”“DeepSeek居然这么回答公安宣传小编”……

用户用来算命甚至买彩票

在全球科技圈现象级爆发的DeepSeek,其背后的大模型创业公司仅成立不到2年。

2024年5月,深度求索(DeepSeek)公司发布开源模型DeepSeek V2,将推理成本降低近百倍,一跃成名。同年12月26日,全新系列模型DeepSeek-V3发布,在大模型主流榜单中位居前列。

今年1月20日,DeepSeek发布了性能对标OpenAI-o1正式版的新模型——DeepSeek-R1,并同步开源模型权重。同一天,其创始人梁文锋亮相总理座谈会并发言,这位来自广东湛江吴川的80后强势出圈。2月5日,广东省高质量发展大会指出,DeepSeek以不怕虎的勇气锐气撼动美国人工智能巨头。

DeepSeek浪潮正持续席卷各行各业。对于普通公众而言,直接通过DeepSeek手机App和网页端,即可免费使用对话模型(DeepSeek-chat)DeepSeek-V3。而DeepSeek也凭借“深度思考”和“人味儿对话”火爆全网,网友们用来算命、谈人生规划、优化简历、改论文,甚至买彩票。

南都记者注意到,2月12日,“中国体育彩票订阅号”公众号发文回应舆论称,“再强大的AI也无法预测中奖号码。大乐透每次开奖都是独立的随机事件,开奖号码均随机产生,根本无法预测。”

而大量用户涌入DeepSeek客户端和网页端,也造成服务器频繁崩溃。

南都记者从DeepSeek官方用户交流微信群获悉,用户屡屡反映服务繁忙、应用崩了、API用不了等问题。DeepSeek官方客服发布的公告显示,“暂不对外进行项目合作,不提供私有化部署及相关支持服务;暂未开放文件上传及联网搜索API接口。”

DeepSeek官网的API开放平台提醒,“当前服务器资源紧张,为避免对您造成业务影响,我们已暂停API服务充值。存量充值金额可继续调用。”据悉,API全称是应用程序编程接口,可基于某软件或硬件得以访问一组例程,是不同软件系统之间进行交互的一种桥梁。

与此同时,“DeepSeek本地部署”的概念和相关教程也开始火了,用户需要先下载免费开源的本地大语言模型运行平台,再把推理模型(DeepSeek-reasoner)DeepSeek-R1下载到自己的电脑运行,这样就不用担心服务器繁忙了。

DeepSeek-R1目前开放了1.5b、7b、8b、14b、32b、70b、671b不同量级的开源模型,b指的是billion,参数量越大,意味着得到的回答质量越高,但需要电脑的GPU资源就越大。其中量级最大的671b,被称为“满血版模型”。

各领域企业如何应用 

在企业端方面,科技、互联网、汽车、手机、基础电信、医药、网络安全等行业领域巨头纷纷宣布接入DeepSeek大模型。

早在1月底,微软、亚马逊、英伟达等全球科技厂商就已宣布接入DeepSeek模型。随后,华为云、腾讯云、百度智能云、阿里云等平台也上线了DeepSeek大模型。华为发文指出,DeepSeek满血版模型,现基于昇腾云服务的全栈优化适配,可获得持平全球高端GPU部署模型的效果,满足业务商用部署需求。

2月6日以来,吉利、岚图、东风、长安、智己等一批车企密集宣布与DeepSeek模型深度融合。其中,吉利汽车集团介绍称,其自研星睿大模型结合DeepSeek推理大模型,最终调动车内的智能驾驶模块、智能座舱模块、生成式交互模块等。

长安汽车宣布,将在最新的车机系统中接入DeepSeek模型,用户可以通过车机语音交互调出DeepSeek模型进行提问。智己汽车官方也发布实测视频,用户可打开“智己大模型”,通过语音对话的方式在车上使用DeepSeek。

此外,华为、荣耀、OPPO等国产手机厂商接入DeepSeek,主要是通过AI助手或智能体,为用户提供与DeepSeek对话、语音交互等渠道。中兴通讯旗下的努比亚则透露,“努比亚选择将满血版DeepSeek-R1全尺寸内嵌至系统,目前正内测中。”

南都记者还注意到,QQ音乐AI助手也接入了DeepSeek,用户可体验音乐问答、歌曲推荐、解析编曲等。百度旗下新搜索智能助手“文小言”(原文心一言App),在上线的学习类功能中接入DeepSeek-R1模型,以此优化拍照解题功能。

办公协作平台飞书也融合了DeepSeek模型,相关应用包括在多维表格字段捷径中可调用DeepSeek R1模型,批量生成文案、脚本、策划,多语言翻译,智能门店巡检等。

那么,企业是如何接入DeepSeek大模型,又是如何应用DeepSeek的呢?

2月13日,中国科学院大学人工智能学院教授、亚太人工智能学会执行主席雷渠江向南都记者分析称,企业接入DeepSeek,主要有API(应用程序接口)接入、定制化服务、本地部署、嵌入现有产品、合作共建平台、模型微调和训练等多种方式。

“其中API接入是最常用的,所有企业都能用。企业无需自行构建复杂的AI系统,可通过调用API接口来实现自然语言处理、语音识别、图像生成等功能。”雷渠江解释称。

除了API接入,一些企业可能需要定制特定领域的知识库、调整模型的输出内容等,这种定制化接入通常涉及与DeepSeek团队的深度合作。而对于一些数据隐私要求较高的企业,可能会选择将大模型部署在自己的本地服务器或私有云上。

雷渠江还介绍道,一些公司会将大模型嵌入到自己现有的产品或平台中,例如智能助手、推荐系统、自动化客服等。有一些大型跨行业合作,深度集成AI技术到行业特定的工作流程中,如自动化医疗诊断、智能化制造等。

最后一种接入方式就是模型微调和训练。“有些企业可能会在DeepSeek大模型基础上进行微调(fine-tuning),以适应自己行业的特定需求或优化性能,这需要企业有一定的AI技术能力,通常会在企业内部团队或外部服务商的帮助下进行。”雷渠江说。

大模型安全风险引关注

在这股汹涌的AI新浪潮之下,为什么这么多企业关注并采用DeepSeek?

从技术层面来看,IDC中国分析师陈佳向南都记者表示,DeepSeek采用的“专家混合架构”(MoE)在同等算力下实现了更高的推理效率,相比于同等规模的大模型训练成本,DeepSeek更具有优势,可最大程度节约企业成本投入,对于最终用户来讲,其部署训练及使用大模型的意愿和能力也将显著提升。

“此外,DeepSeek的开源生态通过GitHub、Hugging Face等平台吸引了全球开发者参与优化与安全测试,形成了充满活力的协同创新生态。在性能方面,DeepSeek模型在数学、代码和自然语言推理等任务上表现出色,尤其在复杂逻辑推理场景中展现了强大的深度思考能力。”陈佳表示。

DeepSeek广泛的应用场景也被看好。IDC中国研究经理程荫在接受南都记者采访表示,“大模型的更新升级将有助于加速应用场景的创新及商业化落地,未来无论是像文案撰写和内容生成、在线会议总结、AI助手、搜索等面向个人生产效率提升的应用,还是面向客服、营销等水平业务职能的场景,抑或是行业特有场景的商业化落地,都将会是今年市场关注的重点。”

随着DeepSeek的火爆应用,大模型调用价格也迎来涨价。 

DeepSeek官网显示,DeepSeek-chat模型(已升级为 DeepSeek-V3)优惠期结束,调用价格已变更为每百万输入tokens 2元,每百万输出tokens 8元。此前DeepSeek在优惠期内的价格为每百万输入tokens 0.1元(缓存命中)/1元(缓存未命中),每百万输出tokens 2元。

与此同时,DeepSeek也被曝出“遭网络攻击”“仿冒网站和钓鱼网站快速增加”。2月6日晚,DeepSeek发布声明回应称,近期有部分与DeepSeek有关的仿冒账号和不实信息对公众造成了误导和困扰,目前DeepSeek仅在微信公众号、小红书、X(Twitter)三个社交媒体平台拥有官方账号。

DeepSeek大模型自身安全问题由此也备受关注。

陈佳向南都记者分析称,从安全视角出发,无论何种使用场景,大模型或生成式人工智能的使用都可能会给最终用户带来新的安全风险。“例如大模型训练数据质量把控不过关,使用有偏见的数据训练生成的大模型会持续输出有偏见的输出。大模型运行所依赖的硬件设施、软件框架、操作系统等,若存在漏洞,会影响大模型的稳定与安全运行。”

陈佳还指出,在内容安全方面,大模型生成内容可能存在不合规、个人敏感信息或企业机密信息以及存在侵权可能的内容,输入内容可能存在恶意攻击指令,会干扰模型推理预测,造成不良后果。在应用层面,DeepSeek还面临传统网络安全问题和应用框架安全双重风险,如DDoS攻击、恶意插件、跨站脚本攻击等。

出品:南都即时

统筹:南都记者 向雪妮

采写:南都记者 冯奕然

版权声明:未经许可禁止以任何形式转载
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开