阿里新专利:图生视频技术,智能化端到端生成无需预设运动参数
近日,阿里巴巴(中国)有限公司在视频生成技术领域取得了新进展,一项名为“一种图生视频方法和装置”的专利被正式公布。据天眼查知识产权信息显示,这项专利的公布标志着阿里巴巴在智能化视频生成方面迈出了重要一步。
该专利的核心在于,通过一种创新的实施例,实现了从静态图像到动态视频的智能化转换。具体而言,该方法首先将包含目标对象的源图像输入到一个精心设计的第一视频生成模型中,从而生成一个基础的素材视频。接下来,根据这个素材视频,系统会自动确定一个帧间变换矩阵序列,这个序列用于描述视频中帧与帧之间的变换关系。
在获取了帧间变换矩阵序列后,系统会进一步从源图像中提取出目标对象对应的对象掩码图像。这个掩码图像相当于一个“模板”,用于在后续步骤中准确地识别和提取目标对象。随后,将帧间变换矩阵序列应用于这个对象掩码图像,生成一系列掩码图像,组成掩码图像序列。同时,将帧间变换矩阵序列也应用于源图像,生成一系列目标对象图像,组成目标对象图像序列。
有了这些基础数据后,系统会根据源图像、掩码图像序列和目标对象图像序列,确定一个目标输入数据。这个数据被输入到一个支持局部重绘的第二视频生成模型中。这个模型能够利用前面的数据,生成一个与目标对象高度匹配、且运动轨迹多样的目标视频。
这种方法实现了智能化端到端的图生视频生成,无需预先设定运动参数。这意味着,系统能够自动地根据源图像中的目标对象,生成具有丰富运动轨迹的视频,同时保持目标对象在视频中的清晰度和连贯性,避免了目标对象的扩散问题。
阿里巴巴的这项专利,无疑为视频生成技术带来了新的突破。随着智能化技术的不断发展,这种图生视频方法将在各个领域发挥越来越重要的作用,为人们的生活和工作带来更多便利和乐趣。
相关阅读
-
ipadmini2现在还能用吗,苹果ipadmini2现在还能用吗
2023年ipadmini2还能用吗?根据目前的技术发展趋势来看,2023年的iPad mini 2可能已经过时,无法满足最新的软件和应用程序的要求。随着时间的推移,新的操作系统和应用程序通常需要更高的处理能力和更大的内存。因此,尽管iPa
-
华为p20pro,华为p20pro上市时间和价格
华为P20 Pro值得入手吗?你好,华为p20pro是一款非常不错的手机。如果你没有以下问题,那是真心非常建议你立即下手购买的了。1,如果你很穷,只买得起红米、小米,那么,很显然,你不值得入手华为p20rpo的了。2,如果你就是看不惯国产手
-
越南计划成为半导体领先国家,雄心壮志与挑战并存
随着全球半导体市场的不断扩大和技术的飞速发展,越南作为一个具有潜力和优势的新兴经济体,正计划成为半导体领域的领先国家,这一雄心壮志的背后,既体现了越南政府对半导体产业重要性的认识,也反映了该国在半导体领域的独特优势和发展潜力,本文将探讨越南
-
深度解析,三星I9100——一部经典的智能手机传奇
亲爱的读者,你是否曾对一款手机的历史和影响力感到好奇?我们要聊的是那个曾经风靡全球,引领智能手机潮流的明星——三星Galaxy S II,型号为I9100,这款手机就像一部活生生的历史教科书,展示了科技与设计如何完美融合,让我们一起走进它的
-
深度探索,联想A370e手机,实用与创新的完美结合
在这个科技日新月异的时代,一款优质的手机不仅是我们日常生活中的得力助手,更是我们了解科技魅力的窗口,我们将聚焦联想A370e,这款以实用性和创新性并重的智能手机,带你走进它的世界,感受其独特的魅力。联想A370e的外观设计:简约而不简单联想
-
华为P10,解锁科技生活的小秘密,让细节说话!
嗨,朋友们,你是否曾想象过手机就像一位贴心的生活助手,能读懂你的喜好,满足你的需求?我要带你们走进华为P10的世界,了解那些看似平常却至关重要的参数,它们就是手机里的魔法公式,让我们的日常生活更加智慧便捷。让我们聊聊华为P10的"心脏"——
