范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

扩散模型家族再添一员,最新ColdDiffusion不再依赖高斯噪声

  任意图像变换方式都可生成。扩散模型或取代GAN?
  作者 | 王玥、李梅
  编辑 | 陈彩娴
  最近,Stability.Ai 公开发布了其文本生成图像模型 Stable Diffusion 的最新版本,网友们的新一波图像创作热潮又开始了~
  图注:Stable Diffusion 生成图像
  前特斯拉 AI 总监 Andrej Karpathy 评论说:这是人类创造力具有历史意义的一天,如此丰富的人类视觉创造力集中体现到了一个人人可触及的产品中。
  从生成图像的效果来看,Stable Diffusion 已经是当前最好的模型之一,而它背后的扩散模型(Diffusion Model)最近也备受关注,显示出要取代 GAN 模型的势头。
  其实,自从 2015 年扩散模型首次被提出以来,该领域本身已经有非常多的研究,研究人员也提出不少变体。而日前,来自马里兰大学和纽约大学的团队提出了近来最新的一种扩散模型:Cold Diffusion。
  1 Diffusion model 再升华
  目前业界出现的扩散模型变体层出不穷,但它们都有一个不变的核心:都是围绕随机噪声去除这个概念建立的。
  扩散模型的本质,以及目前我们对扩散模型的理解,都与高斯噪声在训练和生成过程中所起的作用高度相关。我们可以将「扩散」理解为使用 Langevin 动力学围绕图像密度函数的随机移动,扩散的每一步都需要高斯噪声。扩散始于「高温」状态(即噪音很大的状态),然后逐渐降温到几乎没有噪音的「冷」状态。
  而在这篇叫做"Cold Diffusion: Inverting Arbitrary Image Transforms Without Noise"的最新论文中,作者提出了一个疑问:制作扩散模型的变体,是不是非得使用高斯噪声不可?
  论文地址:https://arxiv.org/pdf/2208.09392.pdf
  通过多次尝试,该研究团队得出了答案:并不一定需要。
  在这篇论文中,作者不再将扩散模型局限于「依赖高斯噪声而建立」,而是提出了围绕模糊(blurring)、下采样(downsampling)等任意图像变换方式建立的广义扩散模型。由于不再有原先的「高温」状态,这种全新广义扩散模型也就被称作为 Cold Diffusion。
  过去标准的扩散模型有两步工作流程:首先,用图像退化算子(image degradation operator)使得图像受到高斯噪声的污染,其次用一个训练好的恢复算子(restoration operator)对图像进行去噪,逆转退化,从而得到一张新图像。
  图注:传统扩散模型的两步工作流程
  Cold Diffusion 继承了这两步工作流程,但又对之进行了升华式的修改。如下图所示,在图像退化再到逆转退化的过程中,Cold Diffusion 研究团队尝试了使用噪声、模糊、变形(Animorph)、遮罩(mask)、像素化(pixelate)、雪花等变换方式,且都得到了不错的效果。
  图注:Cold Diffusion 使用不同图像变换方式得到新图像的工作流程
  工作原理
  对于已知图像 x0,设图像退化算子为D,执行算子的次数为t。
  对以往标准的扩散模型来说,其执行图像变换的前向过程,是由图像退化算子 D 来对图像添加高斯噪声。添加0次时,D 应满足:
  添加t次时,则应有:
  而在 Cold Diffusion 的模型设计中,D 可以用来执行其他各种图像变换方式,如模糊、变形、像素化、雪花等,其退化程度取决于t ——Cold Diffusion 的「升级」正体现在可以进行包括噪音在内的多种图像变换。
  同时我们还需要一个能把xt"变回"图像的恢复算子 R ,应有:
  在有了图像退化算子 D 和 恢复算子 R 后,就可以借用扩散模型的标准方法对算子进行串联使用,从而实现退化运算-逆转退化的工作流程。如果退化运算的次数 t 比较小(t   0),对 R 进行一次应用就可以得到一幅恢复后的新图像。
  由于R通常只经过了一个简单的凸损失训练,当执行退化运算的次数 t 很大时,生成的结果会很模糊。对此,作者团队提出一个改进的 Cold Diffusion 采样算法来生成高质量图像。
  变化无穷
  这篇研究的重点就在于,作者观察到,扩散模型的图像生成并不完全依赖于高斯噪声,我们也可以选择其他图像变换方式来生成新图像。通过改变图像变换方式,甚至可以构建出整个生成模型家族。
  以模糊为退化运算方式
  基于噪声的扩散模型中的前向扩散过程(即退化运算这一步)的优点是,在最后一步 T 处的退化图像分布只是一个各向同性的高斯分布。因此,我们可以首先从各向同性高斯分布中抽取样本,然后通过反向扩散顺序对其进行去噪来执行(无条件)生成。而选择模糊这种退化运算时,完全退化的图像不能形成我们可以抽样的良好封闭式分布,但是可以形成一个足够简单的分布,可以用简单的方法进行建模。
  对于次数足够大的 T,每个图像 x0 都会降级为一个常数 xT(即每个像素都是相同的颜色)。该常数值恰好是 RGB 图像 x0 的通道平均值,可以表示为三维向量,并使用高斯混合模型 (Gaussian mixture model, GMM) 表示。通过对该 GMM 进行采样,可以产生高度模糊图像的随机像素值,然后使用 cold diffusion 就可以进行去模糊化,从而创建新图像。
  另外,像素之间的对称性会导致生成的图像缺乏多样性,为了打破同一管道像素的对称性,作者向每个采样的 xT 添加少量高斯噪声,这个简单的技巧极大地提高了生成图像的丰富性。
  图注:对128   128 CelebA and AFHQ 数据集使用 cold diffusion 的模糊方式变换生成样本示例
  以其他图像变换为退化运算方式
  最后团队进一步证明,除了模糊方式以外,cold diffusion 还可以扩展到其他变换,如修复、超分辨率和变形(animorphosis)方式上,且生成的图像效果也都很好:
  图注:cold diffusion 的生成图像。第一行使用变形方式变换,第二行使用修复方式变换,第三行使用超分辨率变换方式。
  研究团队给出了 CelebA 数据集上的结果,cold diffusion 在修复、超分辨率和变形方面的 FID 得分分别为90.14、92.91和48.51。( FID,即 Rechet Inception Distance score,是用来计算真实图像和生成图像计算的特征向量之间距离的指标。)
  在训练和测试期间不需要高斯噪声的 cold diffusion,突破了人们对扩散模型的原有理解,为新型生成模型打开了未来的大门。
  2 Diffusion Model 时代来临
  这项研究因为提出了一种不同于传统形式的扩散模型,而在近日登上了许多论文排行榜的热门,同样引起了热议的,还有论文其中一位作者在推特上发起的讨论:为什么扩散模型如此迅速地取代了 GAN?
  马里兰大学副教授 Tom Goldstein 解释,扩散模型的优点是它可以最小化凸回归损失,所以 OpenAI 在开发 DALLE 时直接抛弃了 GAN,而使用扩散模型来解决不稳定的鞍点问题(saddle point problem)。
  而且,他认为,扩散模型的成功是新数学范式发挥其作用的一个例子,世界上所有的超参数调整都比不过几行深思熟虑的数学公式。
  要说今天的文本生成图像领域已经由扩散模型统治或许还不够严谨,但 GAN 的一家独大的确已经成为历史。归根结底,谁的图像生成质量和稳定性更好,谁才在越来越卷的生成模型界成为宠儿。这项工作提出的 Cold Diffusion,或许就会在不久之后为我们带来一个新的、强大的文本生成图像模型。
  参考链接:
  https://arxiv.org/pdf/2208.09392.pdf

刁琳宇与姚迪的差距有多大很多球迷认为姚迪才是目前中国女排最好的二传,特别是姚迪能够以半个赛季,38万欧元的世界一线球员价格,加盟意大利联赛排名第二的斯坎迪奇,说明姚迪的水平,得到了世界顶级联赛顶级俱乐部的欧冠八强诞生4席!豪门对决无逆转拜仁米兰晋级巴黎热刺出局北京时间3月9日,欧冠18决赛次回合的第二比赛日,拜仁主场20击败巴黎圣日耳曼,以30的总比分晋级八强。AC米兰客场00战平热刺,以10的总比分跻身八强!首回合交锋,拜仁和AC米兰形势分明,西部赛区交易简评Hi掌握篮板球,掌握命运。回顾本赛季的交易市场,不管是涉及到超级球星还是角色球员的各方交易,整体带来的改变还是相当重要的。东区联盟当中有13支球队参与交易,而西区则是15支球队都进剧本已不在自己手!C组的平局让U20国足没了压力,不用做数学题了北京时间3月9日,U20亚洲杯将进行最后一个小组的比赛,中国男足将迎战小组内相对较弱的一个对手吉尔吉斯斯坦队。由于上一轮爆冷击败了上届赛事冠军沙特队,引发了球迷的无限畅想,但是隔壁(体育)足球女足世界杯奖杯在上海巡展当日,国际足联女足世界杯奖杯巡展活动在上海举行。国际足联日前宣布,今年女足世界杯的奖杯从2月起开始在晋级决赛阶段的32支球队所在的国家和地区举行巡展,首站是日本,中国是第五站,在中杨鸣做出重大决定,虽然赢上海队30分,但对这3人严重不满杨鸣做出重大决定,虽然赢上海队30分,但对这3人严重不满CBA第三阶段比赛的激烈程度在不断升级,但是有一场比赛却成为了球迷们的焦点,这就是辽宁大战上海的比赛。辽宁队在这场比赛中取得12强赛董路老师因保护性接应被骂上热搜,到底冤不冤?今天是3月9日,回想起去年12强赛保护性接应,现在有了更深的理解,愿意分享给热爱足球的朋友们!男足在去年彻底击溃球迷朋友的心里防线时,著名记者董路老师却提出了保护性接应的词语。确实晚场欧罗巴赛事分析!周四001欧罗巴比赛时间3100145罗马VS皇家社会罗马1。罗马主教练穆里尼奥现年60岁,于1987年挂曾执教本菲卡波尔图切尔西国米皇曼联和热刺,夺得2个欧冠冠军,1个欧联元1个闫晓楠VS安德拉德!胜者极有可能将挑战张伟丽!北京时间5月7日,在美国纽瓦克举行的UFC288期比赛中,中国格斗女将闫晓楠(YanXiaonan)将迎来一场生涯最重要的战斗,她的对手是前UFC女子草量级冠军杰西卡安德拉德(Je红军旧将克洛普某些人用得过频,前有萨拉赫今有阿诺德范迪克直播吧3月9日讯据镜报报道,利物浦中后卫范迪克最近的言论表明,红军再一次面临着最近几个赛季曾困扰了阿诺德和萨拉赫的疲劳问题。荷兰人解释说,他觉得自己之前犯了错误,就是过度透支了自己邮报卡塔尔方面希望尽快完成曼联收购,以在夏窗注入转会资金直播吧3月8日讯曼联将在本周四迎来欧战欧联杯18决赛首回合对阵贝蒂斯,赛场之外,曼联俱乐部的出售事宜也在有条不紊地进行。每日邮报报道称,进入曼联收购第二阶段的潜在买家将造访老特拉福
美国担心中国会再次试图征服月球,抢先载人登月成功世界开始进行第二次月球竞赛二十一世纪领先的太空大国都在准备重返月球,着眼于建立月球基地,进行星际移民。只有三个大国拥有载人飞行技术美国,中国和俄罗斯。此外,加拿大欧盟和日本有加盟美解读去有风的地方刘亦菲很美,新剧不够好看刷完前八集,基本可以断定,去有风的地方算得上合格的国产剧,奉为佳作大可不必。先说优点。剧名叫去有风的地方,名字很美,导演也懂得点题。有风是旅馆名字,也是美好生活的象征。第二集开头,网友总结内娱女明星咖位双神赵丽颖杨幂,你认同这个说法吗?双神赵丽颖杨幂赵丽颖的剧总播放量全网断层第一,剧的评分和口碑第一,国民度很高,十年11个卫视年冠奋斗手握四大最强王牌花千骨(有多少人是从小骨入坑的呢?)知否(是谁还在剧荒时一遍遍重奔驰将打造元宇宙工厂特斯拉蝉联全球电车销冠封面天天见封火轮封面新闻记者李思静梅赛德斯奔驰将利用AI和元宇宙技术构建下一代工厂梅赛德斯奔驰在2023年CES期间宣布,公司将在生产流程数字化方面再发力,使用NVIDIAOmniverse平台,再快一点?动态内容如何加速未来已来,只是不均衡地分布在当下近年来Web3的概念在程序员的小圈子也几乎是人尽皆知了。功能再强,噱头再足,但是如果访问速度没有跟上,一起都是浮云。哪怕拿现在已经成熟的Web2。0特斯拉跌没7万亿,谁在狂欢?文二掌柜10ST吉艾的7亿保命钱没了ST吉艾在鬼门关蹦极,终究还是被所谓的大股东给耍了。说好的要打一笔巨款7亿元给上市公司,股价都飞上天了,气氛都已经赶上过年一样欢乐了。当新年的钟2022年新能源车市十万辆成及格线这些车企交付垫底中新经纬1月5日电(牛朝阁)近日,多家新能源车企公布了2022年12月产销(交付)数据,交出了2022年全年的成绩单。2022年12月,新能源汽车购置补贴即将退出,车市消费提前,大特斯拉泡沫破裂后,还有更大的危机在路上图片来源视觉中国1月3日美股新年第一天,特斯拉惨遭开门黑,股价暴跌12。24,创下两年多来新低。特斯拉当天公布的交付数据显示,2022年第四季度全球生产特斯拉汽车超43。9万辆,交53年后才终于明白当年苏联挖穿地球的梦想,为何无法进行下去?长久以来,人类探索的重心总是放在天上,忽视了对地球内部的挖掘。地球内部构造上世纪,苏联开启了一项人类史上最具代表性的挖掘工程,当时的苏联人称,自己要挖穿地球。然而计划赶不上变化,他春节档前瞻一超多强,七部影片热闹上映距离除夕大年夜还有16天,该定档春节的影片都基本上落下尘埃。一向拥挤的春节档,疫情后放开第一年,足足七部电影上映,基本上算是恢复到了疫情前水平,最强春节档似乎回来了。但是最终的票房宇航员连牺牲都不怕,为什么从月球上看地球会感到无比恐惧?月球,是地球唯一的天然卫星,四十多亿年来始终围绕着地球回旋不息。在地球上,人类永远只能看到月球的一面,用肉眼可以依稀辨别出月球上阴暗的月海和明亮的月陆。1960年,美国人做出了一个