范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

谷歌抢先手发布视频生成类AIGC,网友可以定制电影了

  机器之心报道
  编辑:杜伟、陈萍
  AIGC 已经火了很长时间了,出现了文本生成图像、文本生成视频、图像生成视频等广泛的应用场景,如今谷歌研究院的一项新研究可以让我们根据输入视频生成其他视频了!
  我们知道,生成模型和多模态视觉语言模型的进展已经为具备前所未有生成真实性和多样性的大型文本到图像模型铺平了道路。这些模型提供了新的创作过程,但仅限于合成新图像而非编辑现有图像。为了弥合这一差距,基于文本的直观编辑方法可以对生成和真实图像进行基于文本的编辑,并保留这些图像的一些原始属性。与图像类似,近来文本到视频模型也提出了很多,但使用这些模型进行视频编辑的方法却很少。
  在文本指导的视频编辑中,用户提供输入视频以及描述生成视频预期属性的文本 prompt,如下图 1 所示。目标有以下三个方面,1)对齐,编辑后的视频应符合输入文本 prompt;2)保真度,编辑后的视频应保留原始视频的内容,3)质量,编辑后的视频应具备高质量。
  可以看到,视频编辑比图像编辑更加具有挑战性,它需要合成新的动作,而不仅仅是修改视觉外观 。此外还需要保持时间上的一致性。因此,将 SDEdit、Prompt-to-Prompt 等图像级别的编辑方法应用于视频帧上不足以实现很好的效果。
  在近日谷歌研究院等发表在 arXiv 的一篇论文中,研究者提出了一种新方法 Dreamix,它受到了 UniTune 的启发,将文本条件视频扩散模型(video diffusion model, VDM)应用于视频编辑 。
  论文地址:https://arxiv.org/pdf/2302.01329.pdf  项目主页:https://dreamix-video-editing.github.io/
  文中方法的核心是通过以下两种主要思路使文本条件 VDM 保持对输入视频的高保真度 。其一不使用纯噪声作为模型初始化,而是使用原始视频的降级版本,通过缩小尺寸和添加噪声仅保留低时空信息;其二通过微调原始视频上的生成模型来进一步提升对原始视频的保真度。
  微调确保模型了解原始视频的高分辨率属性。对输入视频的简单微调会促成相对较低的运动可编辑性,这是因为模型学会了更倾向于原始运动而不是遵循文本 prompt。研究者提出了一种新颖的混合微调方法,其中 VDM 也在输入视频各个帧的集合上进行微调,并丢弃了它们的时序。混合微调显著提升了运动编辑的质量。
  研究者进一步利用其视频编辑模型提出了一个新的图像动画框架 ,如下图 2 所示。该框架包含了几个步骤,比如为图像中的对象和背景设置动画、创建动态相机运动等。他们通过帧复制或几何图像变换等简单的图像处理操作来实现,从而创建粗糙的视频。接着使用 Dreamix 视频编辑器对视频进行编辑。此外研究者还使用其微调方法进行目标驱动的视频生成,也即 Dreambooth 的视频版本。
  在实验展示部分,研究者进行了广泛的定性研究和人工评估,展示了他们方法的强大能力,具体可参考如下动图。
  对于谷歌这项研究,有人表示,3D + 运动和编辑工具可能是下一波论文的热门主题。
  还有人表示:大家可以很快在预算内制作自己的的电影了,你所需要的只是一个绿幕以及这项技术:
  方法概览
  本文提出了一种新的方法用于视频编辑,具体而言:
  通过逆向被破坏视频进行文本引导视频编辑
  他们采用级联 VDM( Video Diffusion Models ),首先通过下采样对输入视频就行一定的破坏,后加入噪声。接下来是级联扩散模型用于采样过程,并以时间 t 为条件,将视频升级到最终的时间 - 空间分辨率。
  在对输入视频进行破坏处理的这一过程中,首先需要进行下采样操作,以得到基础模型(16 帧 24 × 40),然后加入方差为
  高斯噪声,从而进一步破坏输入视频。
  对于上述处理好的视频,接下来的操作是使用级联 VDM 将损坏掉的低分辨率视频映射到与文本对齐的高分辨率视频。这里的核心思想是,给定一个嘈杂的、时间空间分辨率非常低的视频,有许多完全可行的、高分辨率的视频与之对应。本文中基础模型从损坏的视频开始,它与时间 s 的扩散过程具有相同的噪声。然后该研究用 VDM 来逆向扩散过程直到时间 0。最后通过超分辨率模型对视频进行升级。
  混合视频图像微调
  仅利用输入视频进行视频扩散模型的微调会限制物体运动变化,相反,该研究使用了一种混合目标,即除了原始目标(左下角)之外,本文还对无序的帧集进行了微调,这是通过「masked temporal attention」来完成的,以防止时间注意力和卷积被微调(右下)。这种操作允许向静态视频中添加运动。
  推理
  在应用程序预处理的基础上(Aapplication Dependent Pre-processing,下图左),该研究支持多种应用,能将输入内容转换为统一的视频格式。对于图像到视频,输入图像被复制并被变换,合成带有一些相机运动的粗略视频;对于目标驱动视频生成,其输入被省略,单独进行微调以维持保真度。然后使用 Dreamix Video Editor(右)编辑这个粗糙的视频:即前面讲到的,首先通过下采样破坏视频,添加噪声。然后应用微调的文本引导视频扩散模型,将视频升级到最终的时间空间分辨率。
  实验结果
  视频编辑:下图中 Dreamix 将动作改为舞蹈,并且外观由猴子变为熊,但视频中主体的基本属性没有变:
  Dreamix 还可以生成与输入视频时间信息一致的平滑视觉修改,如下图会滑滑板的小鹿:
  图像到视频:当输入是一张图像时,Dreamix 可以使用其视频先验添加新的移动对象,如下图中添加了在有雾的森林中出现一头独角兽,并放大。
  小屋旁边出现企鹅:
  目标驱动视频生成:Dreamix 还可以获取显示相同主题的图像集合,并以该主题为运动对象生成新的视频。如下图是一条在叶子上蠕动的毛毛虫:
  除了定性分析外,该研究还进行了基线比较,主要是将 Dreamix 与 Imagen-Video、 Plug-and-Play (PnP) 两种基线方法进行对比。下表为评分结果:
  图 8 展示了由 Dreamix 编辑的视频和两个基线示例:文本到视频模型实现了低保真度的编辑,因为它不以原始视频为条件。PnP 保留了场景,但不同帧之间缺乏一致性;Dreamix 在这三个目标上都表现良好。
  更多技术细节请参阅原论文。

陈博雅在全锦赛上荣膺最佳接应,那么对龚翔宇的主力有威胁吗?陈博雅打的是主攻!排协硬生生给她个最佳接应!搞笑的一逼陈博雅一传防守实在是太差了,中国女排不缺进攻人材,缺的像龚翔宇和张常宁这种既能防守又能牵扯反攻的球员,同时解放了副攻的压力。如客观来说,国足对阿曼的比赛,徐新的个人表现怎么样?很不错啊!说明中国有好球员!现在讲中国足球运动员差的,基本上,都是跟着足协的口径来发表言论的!中国缺的就是好教练,特别是没有私心的教练!以国家利益为追求的教练!问题是,现在中国足球夜间开车走高速公路比白天危险多少?我目前驾龄3年,时间不长不短,但是我要说,不到万不得已,坚决不在夜间上高速。因为以我目前的驾驶经验,城市道路在夜间驾驶的时候危险系数比白天大十倍不止,夜间的路上,各种霓虹灯路灯对面如何快速鉴别葡萄酒的真假?江湖上一直盛传着一分钟鉴别真假葡萄酒的绝招,我们就在网上找出了两大鉴别真假葡萄酒的独门秘方鉴定方法一食用碱鉴别真假红葡萄酒1用小半勺家用食用碱放一点水兑开2准备一张普通的餐巾纸3滴怎么可以获客?很荣幸回答你的问题。精准获客换句话说就是精准引流。引流又可以拆分来分析,流指流量,注意力,客人。引可以理解成吸引,勾引,诱惑。怎么吸引,勾引,诱惑呢?一件东西或者一件事情,他没有你儿子大三被降级上大二,降级后还是不好好学习,全部挂科,我该怎么办?说一个真实的事情,我身边的同学。我本科是在安徽省内的一所重点大学,工科专业,一个班是32人,28个男生,4个女生。我们班男生都集中住在几个宿舍,4人一间,上下铺。大一大二都是类似于北方有什么好吃的是南方吃不到的?湖南嫁东北黑龙江,正经的从南到北哦!要说好吃的,南北很有很多代表,比如湖南的剁椒鱼头,腊肉,臭豆腐,米粉等。黑龙江的水饺,手擀面,锅包肉,烩酸菜,凉菜等等。回到主题南方东北菜馆还蛮羊肉怎么做好吃?农村美食中心白萝卜炖羊肉原料白萝卜500克,羊肉250克,酱油30克,白糖50克,葱15克,姜15克,大茴香2个,植物油50克,料酒盐味精备适量。做法1将羊肉洗净,切成5厘米见方的福建海钓哪里最好?有幸为你解答讲到钓鱼我可就来劲了!福建海钓的话我比较推荐漳州,莆田,还有泉州崇武这边。其实出船钓鱼的话,都差不多,哈哈因为沿海的大片海域大同小异!我是在泉州,疫情期间就经常去钓鱼,新款塞纳,和新款汉兰达,哪个实用?我就是一个汉兰达与新款赛那反复纠结好久的人,要退休了想要一辆带我远行床车,耐用小毛病少,油耗底,驾驶舒适。从房车到硬派越野SUV看来看去看到新款汉兰达,比较适合我,刚定车又出来了赛你买过最值的二手车是哪辆?为什么?你好,我来回答这个问题,我是检车家的一名二手车检测技师。工作的原因经常接触各种车型,所以对于这个问题还是相对有所了解的,下面我就从我个人的角度回答一下你的问题。首先需要说明的是,不
太阳系八大行星详解今天与大家一起了解下太阳系,太阳系包括太阳8个行星(包括我们所生存的地球)近500个卫星和至少120万个小行星,还有一些矮行星和彗星。早期太阳系是九大行星,冥王星于2006年正式定宇宙真的存在边界吗?如果放大再放大,会出现细思极恐的事情2018年10月,新科学家杂志发布了一则意大利科学家的最新研究,他们发现了一个巨大的超星系团,并认为其已经打破了形成最早质量最大的记录。不少国内的媒体,将其报道翻译成了宇宙墙,甚至神十四乘组顺利进入梦天实验舱在北京航天飞行控制中心拍摄的空间站梦天实验舱完成转位的模拟图像11月3日在北京航天飞行控制中心拍摄的神舟十四号航天员陈冬进入梦天实验舱据中国载人航天工程办公室消息,昨日15时12分WTA年终总决赛第二日斯瓦泰克加西亚取小组赛开门红斯瓦泰克当地时间11月1日,WTA年终总决赛展开小组赛第二日的争夺,世界第一斯瓦泰克取得开门红,以6263轻取8号种子卡萨金娜。凭借这场胜利,斯瓦泰克将自己与卡萨金娜的交手记录刷新为什么岗村宁次在听到投降指令后,不退兵,而是继续发起进攻?历时14年的侵华战争是中国近代历史发展过程当中持续时间最长且影响最为深远的反侵略战争,上个世纪30年代,日本由于本国的资源没有办法支持其继续发展,所以便走上了军国主义扩张道路,他们第三章夏商周时代(7)3。伊尹辅政商汤死后,上古贤相伊尹成为商朝的重要辅臣。他的三个儿子,大儿子太丁死得早,于是伊尹扶持二儿子外丙继位。三年后,外丙也死了,伊尹又立他的弟弟仲壬为王。过了四年,三任帝子仲二战德国为什么会失败呢?纳粹的失败可以说是必然的,主要有以下几个方面的原因经济纳粹德国当时虽然为世界第二经济强国,但是深陷经济危机当中,再加上德国在一战后所有海外殖民地全部被瓜分,缺乏海外的原材料与兵源补闲说灌口城隍庙在旧时,几乎每个县都有城隍庙,城隍老爷主管本县的阴间运行,掌握世人的生死大权,也起教化世人的作用,辅助人间的县令治理一方。玉垒山牌坊后面就是城隍庙后来,放眼神州城隍庙基本上都消失殆清朝妃子侍寝,真的是脱光光再由太监抬进去?清宫戏,是历史谣言的重灾区。清朝妃子陪皇帝睡觉,先由太监把她洗刷干净,然后不穿衣服,赤条条地,由太监用被子卷起来,抬进皇帝的寝宫。这一幕不但在很多地摊历史书里出现,而且很多清宫戏,韩国乒坛女神,穿樊振东球衣,叫樊振东东哥,想跟小胖组跨国搭档虽然是一名韩国乒乓球运动员,但田志希却对国乒队关注尤甚,接受采访时表示,国乒女队的三朵金花陈梦孙颖莎王曼昱三人,实力强大到可以冲击男子比赛的奖牌。虽然田志希说的是实话,但这话由一位孙兴慜在更衣室里,眼睛肿得睁不开了!但韩国欧巴依然面带微笑我在头条搞创作第二期孙兴慜受伤了!他2次出战世界杯2次痛哭,韩国队完全仰赖他北京时间2022年11月2日星期三消息。相信今天凌晨的欧冠比赛,韩国球迷是非常紧张的,因为他们球队中的当