强人工智能时代媒体的实践与思考

南方传媒研究
+订阅

【摘要】人工智能技术正成为重要的生产力工具,重塑业务流程和变革工作场景,高度而且精准地影响媒体行业发展。从PGC、UGC、PUGC到AIGC,生产模式不断转变;从ChatGPT(文本生成)到sora(视频生成),以及跨模态多模态生成,大型预训练模型持续演进。媒体积极应用人工智能技术持续开展探索实践,以形成突破性创新,实现“从能用到可用、再到好用”的优势升级。

【关键词】生成式AI  大模型  机器写作  数智人  智媒云

近年,AIGC持续火热。它将人工智能与自主意识、推理思考等特征结合,形成解决问题的最优方案,是弱人工智能走向强人工智能的重要节点。2023年,国家互联网信息办公室针对生成式AI发布规范性政策——《生成式人工智能服务管理暂行办法》,在坚持发展和安全并重、促进创新和依法治理相结合的原则下,采取有效措施鼓励生成式人工智能服务在多领域的探索和产业化发展。本文基于南方智媒云建设,从实际工作中总结人工智能技术在媒体领域的场景化产品应用,并提出一些思考。

一、人工智能加速媒体智慧转型

(一)催生新型内容生产模式

当前,内容生产方式正经历着从PGC(专业生产内容)、UGC(用户生产内容)、PUGC(专业媒体与用户联合生产内容)到AIGC(人工智能生成内容)的变迁。AIGC这种新型内容生产模式构建了从数据、创意到创作的生产通路,将实现过程变成可重复、可持续的算法劳动,支持全天候内容生产,同时完成大规模生产效率的飞跃式提升;又因来源丰富的写作素材、个性化创作视角、沉浸化技术手段,增强了新闻作品的表现度。AIGC创作赋能增强内容供给,有助于实现内容产业高效的链接交互和市场配置,形成更加开放的商业闭环。

(二)升级传播智能化方式

人工智能技术的深入应用,引发人机关系的迭代,“人”与“机”同样置于主体地位。它们之间的紧密协同互动,增强了“主体、内容、渠道、受众、反馈”等媒体传播要素的耦合度。一方面基于数据处理和算法策略,有助于提升新媒体信息的分发流转效率;另一方面根据用户接触信息的习惯和偏好进行即时推送,贴合用户体验,提升传播的“技术感”;再者建立信息传播热度、趋势以及用户认知层面、态度层面和行为层面的反馈模型,根据反馈结果形成自我调节机制,达到有效的传播状态。

(三)更新媒体产业生态结构

人工智能重新定义媒体,正由点到面、从局部到整体为媒体产业带来新的活力。对于存量业务,人工智能的主要价值在于降本增效;而对于增量业务,伴随着人工智能的逐步成熟和规范,将不断拓展媒体的产业形态和边界。如通过提升内容创作生产力和数字感官体验,直接促进数字广告、数字藏品、数字展馆、数字版权等数字化信息行业的消费升级。人工智能还支持媒体的人、财、物等关键资源要素的数字化感知、科学配置和风控监管,通过运营管理价值评估,优化媒体生产关系,提升整体竞争力。

二、人工智能赋能媒体的若干应用实践

(一)AI智能问答——“模型即服务”在媒体的场景化适配

“模型即服务(MaaS)”是指以模型为核心提供产品、技术和服务。在ChatGPT热潮出现后的“百模大战”中,这一概念被频频提及。大模型建设是包括大数据、大算力、强算法等全栈技术的复杂系统性工程,媒体应用的关键在于运用MaaS推动AI大模型的场景化落地和简洁化应用。

在相关法律法规指导下,南方报业传媒集团在内部发布《生成式人工智能服务管理与使用规范》,南方智媒云随后面向采编使用场景推出“智能创作小助手”,在调用通用大模型的基础上,面向媒体应用场景开展二次开发优化以满足适配需求。“智能创作小助手”本地化部署和提供服务,构建以对话回答为中心实现人机交互的界面中枢,这个中枢同时具备智能代理的功能,目前已接入GPT4、文心一言、讯飞星火、腾讯混元等通用大模型。当用户以自然语言发出对话指令,界面中枢调用不同的AI模型,协同生成回答。“智能创作小助手”在技术侧通过用户与AI模型之间的对话学习养成,以及业务数据的反哺和调优,持续在具备泛化能力的预训练模型底座上,总结媒体业务特征和规则,“端对端”以较低门槛形成专属模型,最终面向媒体从业者提供更加强大的信息整合分析和提炼归纳能力,以及更为精准的问答式搜索服务,提升信息获取效率。

(二)AI机器写作——“以小博大”小模型应用在专业领域的恰到好处

相较于动辄千亿级参数的大模型,小模型的计算复杂性大大降低,执行专业任务往往只需更少的计算和存储需求,同时具备更快的推理速度。建设小模型的意义在于,通过输入更为精细的数据集,提升模型的可理解性和解释性,从而把控输出模型的精度和质量,实现功能价值的最大化。

2023年3月,南都“湾财AI快报”2.0版率先发布。“湾财AI快报”的前序1.0版是2019年南都推出的“小南”写稿机器人,它通过财经类新闻写作模板,提取关键信息转化为程序化、结构化的叙述性文本,已生成文字稿件超过十万篇,发稿数千篇。不同于1.0版,“湾财AI快报”2.0版的特点在于:第一,数据来源更为广泛,增加从银保监会、证监会、上交所、深交所、裁判文书等渠道采集数据,同时接入金融行业动态数据;第二,突破单一新闻视角,聚焦上市公司高管变动、财报速递、股票异动评论以及处罚通报等关注度较高的维度;第三,依托南方智媒云在财经领域训练超30亿条存量数据,搭建30个垂直数据库,定义优化110个数据模型,增强小模型的建模推理力。

“湾财AI快报”2.0版一方面取代劳动密集型的信息搜集工作,可围绕设定议题形成持续量产规模效益;另一方面突破机器写作常用的模板化创作方式,探索基于增强学习的人机耦合模式,产品形态和逻辑“由浅入深、从精确到模糊”,通过关联和组合信息要点,生成更有深度、更立体、更综合的稿件。为配合机器写稿,编辑器也同步定制升级,单篇稿件最快生成速度在3分钟内,经“三审三校”机制后可快速发布。更具突破性的是,它在数据模型和算法测量中加入“写作框架、叙事语气、语言润色”等随机因素,让生成文稿更显多样化,由其创作生产的新闻成稿更接近人类自然语言的语法,并逐渐呈现出情感特征。改进后的“湾财AI快报”2.0版篇均阅读量增长36%,其中单稿最高阅读量190万。

(三)AI融媒生产——在产品表现层充分释放AI创意与创造力

AI技术能够“低成本、高效率”地在生产端实现文、图、视频等不同形态和风格的转化,并在用户端提供技术更先进、沉浸感更强的产品交互体验。

南方智媒云将Stable Diffusion、Midjourney等主流AI绘画平台的通用风格模型本地化,将自有图片加上期望效果的图片素材作为增量样本进行模型再训练和微调。这样做,可以横跨AI绘画平台,泛化性高,更具有开放随机性,同时保持自有特色元素。在这个平台中,通过输入定义正向和反向提示词,实现零基础生成初始插图或实景图,并且不断调整描述词,完善对图片创作需求的多次拟合,辅助绘画上色、细节优化和风格转化等产品设计工作。如南都APP发布的《最美松山湖人》《广州城市生活地图》等创意产品中分别应用AI绘画文成图、图生图功能,快速实现图片风格迁移。2024年,N视频发布的《AI视频看网红城市》混合使用工具实现视频风格转化,降低制作成本。

南方智媒云当前已提供AI人脸融合等模块化技术能力,与内容创意玩法相结合,优化图片融合规则,实现头像、照片与特定形象的脸部融合,同时支持单应用多模板、用户切换背景、自定义贴纸、一键生成卡片分享。如在南方+发布的《+游广东,拍下属于你的城市PLOG》等产品中成熟应用了AI人脸融合,营造用户的代入感,全网流量超过200万。

(四)AI内容审校——基于大语言模型增强全栈式校对能力水平

面对新媒体平台日益增长的生产发稿量,人工智能能够辅助细致精准的审核校对工作,支持图文、音视频等多模态审校,覆盖稿件、广告、H5作品,以及用户头像、昵称、评论等全场景,同时校对速率和准确性比传统方法都更胜一筹。

媒体建设AI内容审校的优势在于:第一,拥有高质量的私域数据集进行预训练,如南方智媒云AI内容审校充分利用经搜集、整理、筛选和标注的南方报业沉淀70多年的中文新闻语料库;第二,基于业务场景和语言环境的知识沉淀和规则积累,尤其是专业词库的持续建立和更新;第三,建立基于人类反馈的强化学习模式,媒体编辑可以对机器审校结果进行是否采用、如何采用等专业判断,通过人工反馈促进模型强化学习和迭代升级。2023年,在通用大语言模型的加持下,南方智媒云AI内容审校推出的“智媒云盾”,能够在巩固政治性内容校对优势的基础上,实现面向文字性、知识性等中文文本差错,以及基于语义关系理解和推理性差错的检校升级。在中文文本纠错(CSC)任务数据集SIGHAN上的测试效果对比,“智媒云盾”查错纠错能力的F1值已明显优于各主流商业软件。目前“智媒云盾”已全面应用于南方日报、南方+、南都APP、N视频等采编全流程,每年自动校对文字量超51亿字、图片67万张、视频超58万个,校对采用率达到96%。

(五)AI热点发现——事件图谱在新闻场景下的传播脉络分析

知识图谱是通过对实体和关系之间的交互表达,实现对人类知识的一种显性刻画,使得机器能够像人类一样去理解客观世界。从知识图谱到事件图谱,通过对事件信息以及事件之间关联关系的客观准确表达,应用于新闻场景十分契合。

南方智媒云运用大模型技术实现事件抽取、信息补全、关系推断和事件预测,构建的事件图谱已被用于热点事件检测、事件脉络分析以及未来事件预测。如AI热点发现每小时滚动生成100个热点事件,对指定事件、突发新闻、重大情报进行实时识别和追踪,同时快速提取事件关键信息,深入挖掘事件脉络,协助采编人员了解事件发展趋势及舆论风向。该项能力还被用于分析南方+客户端内的用户评论,帮助内容创作者和运营者更好地了解用户关注热点,从中发现高价值、高影响力的话题,更好地挖掘内容报道角度,丰富互动形式,活跃“端相”。

(六)AI虚拟主播——“高精度、交互式、超写实”小样本数智人应用

AI大模型推动人机交互模式的革命,使得新一代数智人的形象更逼真、实现成本更低、互动更智能,相比数字人更为进化。

2022年11月,南都N视频在业内率先推出虚拟主播“小N”,实现24小时全天候无间断新闻视频输出,作为真人主播的“数字分身”大大提高新闻生产效率。2023年应用小样本数智人,基于较少的训练样本,就能够对“小N”的人像特征、光照阴影等实现建模进行细节优化和实时渲染,同时基于智能人像驱动,对真实对话场景下的口型关系绑定、表情变化、手势变化的捕捉更加精准。此外,南都还推出另一个3D动画形象主播“岭梅香”,被用于《探宝觅踪——寻找湾区民间文化力量》融媒策划中,通过数智人应用快速生成更写实的数字化形象,并赋予其特定的任务身份设定。

针对数智人应用,南方智媒云定制研发了富文本编辑器,创作人员通过组件切割、拼接和插入等逻辑,实现虚拟主播的形象选择、画面配置、样式交互和数据绑定等功能,并在语音识别和合成上作了优化,支持多音字识别正确读音,支持异步任务排队、分段试听等方法来实现长文本的试听合成。南都N视频已将该富文本编辑器集成到生产发布流程中,支持专业内容生产。如2024年全国两会,N视频在创作平台虚拟主播的工具支撑下快速制作和发布H5产品《穿越时空!AI畅述广东过去与未来》;还可以面向视频平台创作者开放使用,助力视频号快速定制化广告宣传实现商业变现。

三、媒体AI赋能的机遇和挑战

(一)人工智能的升级进化为媒体带来更多想象

2024年2月16日,OpenAI宣布推出全新的生成式人工智能模型Sora,通过文本指令,Sora可以输出长达60秒视频,包含高度细致的背景、复杂的多角度镜头,以及富有情感的多种角色。Sora的出现及视频生成效果引发热烈讨论,这代表人工智能进化到一个更高阶段。从最初的“AI识别”,机器像人一样去认识事物,如图像识别、语音识别、视频识别;到“AI理解”,通过学习人类知识和模仿人类语言,如通过GPT的广泛应用,更加友好地判断语义逻辑和实现更为准确的多模态理解;再到如今的“AI意识”,能够逐步发现和学习理解人类与世界互动过程中的隐藏知识和物理定律,如Sora能够精细刻画阳光下湖面的光影变化,以及特定复杂动作的表现逻辑、细节和特效等,极大地提高表达真实感。

“AI识别—AI理解—AI意识”的进化正如人类认识世界、理解世界、创造世界的成长过程。Sora从表象上看是一款文生视频工具,大幅度降低了广告、短视频、游戏等行业的制作门槛。如2024年,人民日报客户端发布AI共创大片《江山如此多娇》,中央广播电视总台将国家统编语文教材中的诗词通过文生视频制作成AI动画片《千秋诗颂》,AI所带来的是视频生产力的快速提升。从科学意义上来看,正如高文在鹏城实验室公众号发布的《人工智能前沿技术和高质量发展解析》一文中所提到的,Sora是从通用性的人工智能迈向人工通用智能的一个起点。

(二)“用AI守护AI”关注深伪内容安全治理

由于人工智能生成内容的能力越来越强,它的应用将颠覆“眼见为实”“有图有真相”的传统认知。如何减少滥用AI进行深度伪造产生虚假信息,不仅需要建立完善相关法规监管,同时要用“AI鉴真”对不法行为形成技术压制。

“AI鉴真”用AI守护AI,覆盖AI文本、图像、音视频等多模态内容的检测鉴别,尤其针对使用人脸生成、替换、声音合成、表情迁移等技术产生深伪内容的检测和防范。随着相关技术应用的深入,未来将有更多准确可靠的AIGC检测产品和服务面市。同时,媒体还开始关注模型的安全性,包括训练数据安全、模型防攻击、模型输入安全保障,从训练到推理的全过程,把好内容安全的“方向盘”,确保生成内容的导向正确和合法合规。

(三)用主流价值观纾解AI算法焦虑和流量焦虑

人工智能技术的赋能,机器可以基于算法根据用户个人兴趣定向生产和分发信息,内容信息的选择标准和生产逻辑受到算法的影响,用户关注及流量成为内容价值判断的重要标准之一。这种现象的过度发展往往会导致信息过载或过窄,情感温度的缺失,一定程度上带来用户对主流报道和公共领域的关注度弱化。

构建主流价值观精准传播体系,用主流价值导向驾驭算法、收割流量,这是全国党媒平台持续深入实践的课题。技术需要建立数据获取、特征工程、模型算法、推荐引擎、效果评估的完整架构和流程闭环,支撑运营做好用户特征研判、媒介接触习惯、信息偏好、界定认知圈层等主流媒体的精准受众分析;在过程中加强智能内容审核和标注标签体系能力建设,辅助强化“把关人”机制;同时不断拓宽多端分发渠道,运用算法推荐与专家推荐相结合的策略,提升用户侧主流价值观的传播面和抵达精度。

(四)AI版权是作品独创性与技术应用革新的深刻探讨

随着人工智能生产创作的作品不断涌现,对现行的版权制度提出很大的挑战,引发一系列悬而未决的AI版权争议。主要包括:在输入端AI训练阶段,使用受版权保护的作品作为训练数据,以及在输出端AI使用阶段,通过AI二次创作形成作品的著作权在模型提供者和使用创作者之间如何分配。如2023年11月,OpenAI被11位非虚构类书籍的作者指控侵权使用其所著作品训练大语言模型;2024年2月,广州互联网法院判决某人工智能公司在提供生成式人工智能服务过程中侵犯了原告对案涉奥特曼作品享有的复制权和改编权。

如何从输入端到输出端在AIGC全生命周期还原所有参与方对AI作品的影响贡献度,基于贡献度形成合理合规的数据确权以及普遍认同的权利分割原则,成为实践中面临的难题。可以预见的是,在生成式AI对大量数据学习和模仿的形势下,区块链技术将会被内容创作者更深入和广泛地应用于保护作品的原创价值,通过版权追踪侵权行为,实现有力维权。

四、结语

人工智能技术的崛起和广泛渗透,对各行各业产生颠覆性影响,也为媒体生产传播和产业发展带来了全新的范式,催生涌现一系列典型应用。媒体变“静态被动”为“动态主动”,在防范风险的前提下,将点状的AI应用不断进行网状联结、链式拓展和全局覆盖,使之成为建设全媒体传播体系、实现高质量发展的新质生产力,必将逐渐呈现出一个未来媒体的基本形态。(参考文献略)

作者:

吴娴  南方智媒科技公司副总经理(首席技术官)

罗小龙  南方智媒科技公司数据治理与智能化研发中心总监

周炳文  南方智媒科技公司媒体创新中心副总监

王瑞成  南方智媒科技公司N视频产品研发中心副总监

林晓敏  南方智媒科技公司综合业务支持中心高级研发工程师

南方传媒研究  2024年第3期  总108期

欢迎订阅《南方传媒研究》

本刊邮发代号:46-582

本刊唯一投稿、合作邮箱:

nfcmyj@163.com

版权声明:未经许可禁止以任何形式转载
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开