12月3日,“2024数字科技生态大会”期间,首届“TeleAI 开发者大会”在广州举办。会上,TeleAI(中国电信人工智能研究院)发布视频生成大模型、视觉大模型产用一体化平台、具身智能、智传网等一系列创新技术、产品及科研成果,并发布开发者产业联盟计划。

本次发布的视频生成大模型创新地打造了“VAST(Video As Storyboard from Text)二阶段视频生成技术”,通过文本描述精准勾勒出包含视频构图、主体目标位置及人物姿态等关键信息的“故事板”(Storyboard),进而生成对应的视频内容。
得益于 VAST 的创新能力,视频生成大模型可以保证单个或多个主体人物在各视频片段中的外观一致性,实现对复杂动作和交互式动作的精确控制,并让角色和目标物体的运动符合物理规律。基于此,通过语义、语音、文生图、文生视频等全栈大模型能力打通短剧及影视制作的各个环节,覆盖文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程,实现降本增效。目前,TeleAI 视频生成大模型在权威视频生成评测榜单VBench中排名第一。视觉大模型实现了对传统检索类目的指数级提升,以及对十亿级目标检索的秒级响应。
目前,中国电信构建了视觉大模型产用一体化平台,通过算法冷启动回流数据,摆脱了传统模型对大量数据的依赖,实现0训练数据直接推理,显著降低算法应用的准入门槛。同时,平台还支持小样本训练,仅需100个样本数据就能训练出高精度模型,实现模型生产的全自动化过程。目前,该平台已成功应用于多省应急项目,沉淀了20余个应急全流程感知场景,提升对灾害研判与应急响应的核心能力。
随着本次视频生成大模型和视觉大模型的发布,星辰大模型系列进一步完成了其全模态能力的构建。
中国电信CTO、首席科学家、TeleAI院长李学龙作主旨演讲。他以“当梦想照进现实”为题进行分享,并发布星海AI中台、天翼AI开放平台、星辰智能体平台等开放平台,助力开发者大幅降低开发门槛,构建低成本、高效率的创新开发生态。同时,他介绍了 TeleAI 在大模型全模态、全尺寸、全国产化体系构建的最新进展,及让智能可以像水一样流动到任何地方的智传网技术前瞻布局。
全模态,包括语义、语音、视觉多模态,可以为开发者提供丰富的全面能力。
全尺寸,电信是央企里唯一的开源大模型,在全国产化的万卡集群和国产深度学习的框架上,推出并且开源了Telechat2系列模型,实现了十亿级、百亿级、千亿级的参数模型的全尺寸的覆盖,目前全网模型的下载数量超过了4万次。
全国产,所谓“李杜诗篇万口传,至今已觉不新鲜”,发布大模型已不是什么新鲜事了,但中国电信实现了全国产的万卡万亿参数的大模型训练,推理包括配套的工具链全都是基于国产的硬件和软件平台,实现了从底层架构到上层应用的全面的国产化,为开发者提供了安全可靠的研发环境。
同时,还给开发者提供了三座平台,分别是星海AI中台、天翼AI开放平台和星辰智能体平台,前两个分别面向初级开发者、专业用户级,星辰智能体平台则为软硬件结合。
此外,在本次数字科技生态大会的线下展台,TeleAI 还展示了一系列在具身智能方向的创新成果,包括可以用于生活服务的人形机器人、面向商场及展会场景的星小辰服务机器人、为视障人士提供导盲服务的智能机器狗,及整合了一系列大模型能力的AI智能眼镜。展出了星辰软件工厂、星辰慧记、星辰智能体产品、中国电信家庭小管家、星辰大模型一体机等一系列智能产品,让现场观众真实感受未来已来,AI 就在每个人的身边。
南方+记者 郜小平
订阅后可查看全文(剩余80%)