这4秒虽短,但对AI大模型意义很大|数说网事

南方+

本文收录于专辑#数说网事#

近日,淘天集团旗下阿里妈妈技术团队宣布推出高保真图片生成视频框架——AtomoVideo(阿瞳木视频),可将图片素材自动化转换为高质量视频动效。目前,该技术已在阿里妈妈的万相实验室、广告投放平台等应用场景上线,所有商家都可以体验“图片一键变视频”的人工智能新技术,快速生成创意短视频。

如图

如图

如图

年初OpenAI公司Sora的发布,让人们看到了视频智能创作的巨大想象力。实际上,国内很多团队也在文生或者图生视频上有着大量探索。今年初,字节跳动发布了超高清文生视频模型MagicVideo-V2,阿里云旗下魔搭社区(Model-Scope)上线文本生成视频大模型。

如今阿里妈妈发布的AtomoVideo应用,让电商人眼前一亮:以后的商品视频,可能不用再找专业拍摄团队来干了。

据南方+记者在AtomoVideo的体验中发现,用户上传一张图,输入动作文字指令,静态的图片就能在各种场景中动起来。比如,上传一张玩偶图片后输入文字指令:穿红色衬衣的玩偶在街上散步。很快,一段短视频就生成了,玩偶迈开步伐行走,街景也跟着变化。此外,静态的帆船也能在输入指令后在大海中扬帆起航,海报中的乐手也开始弹奏吉他演奏,场景还原和人物表情、动作,都接近专业动画师水准。

据了解,AtomoVideo应用了阿里妈妈技术团队自研的诸多新技术,包括优质数据集构建、多粒度图像注入、渐进性动作强度增加的多阶段训练等,目前可以支持任意像素的图片生成4秒视频动效,并兼容市面上各种文生图模型。据悉,视频生成功能已在阿里妈妈广告平台广泛应用。商家可以在阿里妈妈电商图片生成工具“万相实验室”中,一键将制作的商品图片转化为商品视频。同时,阿里妈妈的设计师也可以应用该技术,为商家客户量身定制视频创意并投放。

阿里妈妈一位技术人士在接受南方+记者采访时表示,当前技术还远未挖掘出视频生成的真正潜力,在视频画面稳定性、内容创造可控性以及视频时长等关键要素上,仍有非常广阔的探索空间。这位人士认为,当前的应用生成虽然只是起步,但随着技术模型不断迭代,视频生成的准确度和仿真度也会逐渐提高。

【采写】南方+记者 叶丹

【摄影】南方+记者 王俊涛


编辑 刘静
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开

暂无相关推荐