美文网首页
MultiDiffusion:用于受控图像生成的融合扩散路径

MultiDiffusion:用于受控图像生成的融合扩散路径

作者: Valar_Morghulis | 来源:发表于2023-02-28 10:08 被阅读0次

MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation

Feb 2023

Omer Bar-Tal*, Lior Yariv*, Yaron Lipman, Tali Dekel  (* Equal contribution)

[Weizmann Institute of Science]

https://arxiv.org/abs/2302.08113

https://github.com/omerbt/MultiDiffusion    >285 stars

https://multidiffusion.github.io/         ★★★★★

利用扩散模型生成文本到图像的最新进展显示了图像质量的变革能力。然而,所生成图像的用户可控性和对新任务的快速适应仍然是一个开放的挑战,目前主要通过对特定图像生成任务进行昂贵且长时间的重新训练和微调或特别适应来解决。在这项工作中,我们提出了MultiDiffusion,这是一个统一的框架,使用预先训练的文本到图像扩散模型,无需任何进一步训练或微调,即可实现多功能和可控的图像生成。我们方法的核心是基于优化任务的新生成过程,该优化任务将多个扩散生成过程与一组共享的参数或约束绑定在一起。我们表明,MultiDiffusion可以很容易地应用于生成符合用户提供的控制的高质量和多样化的图像,例如期望的纵横比(例如,全景)和空间引导信号,从紧密的分割掩模到边界框。项目网页:https://multidiffusion.github.io

Recent advances in text-to-image generation with diffusion models present transformative capabilities in image quality. However, user controllability of the generated image, and fast adaptation to new tasks still remains an open challenge, currently mostly addressed by costly and long re-training and fine-tuning or ad-hoc adaptations to specific image generation tasks. In this work, we present MultiDiffusion, a unified framework that enables versatile and controllable image generation, using a pre-trained text-to-image diffusion model, without any further training or finetuning. At the center of our approach is a new generation process, based on an optimization task that binds together multiple diffusion generation processes with a shared set of parameters or constraints. We show that MultiDiffusion can be readily applied to generate high quality and diverse images that adhere to user-provided controls, such as desired aspect ratio (e.g., panorama), and spatial guiding signals, ranging from tight segmentation masks to bounding boxes. Project webpage: https://multidiffusion.github.io

相关文章

  • #ENVI IDL#ENVI系列之二 :遥感影像数据:图像融合Ⅰ

    图像融合 图像融合是将低空间分辨率的多光谱图像或搞光谱数据与高空间分辨率的单波段图像重采样生成一幅高分辨率多光...

  • Mode Seeking Generative Adversar

    论文: 用于不同图像合成的 模型寻找的 对抗性网络 (用于生成 更多的图像 ) 1 cGans 会出现 模式崩溃...

  • GLIDE: Towards Photorealistic Im

    扩散模型(diffusion model)可以生成高质量的合成图像,尤其当基于某种条件引导(guidence)时,...

  • HTML---图像标记和表格标记

    1.图像标记 基本语法格式: src属性用于引入图片,指定图像文件的路径,包括绝对路径或相对路径(同级目录(同一文...

  • 改进StyleGAN的人脸融合系统(源码&教程)

    1.研究背景 针对人脸融合过程中出现的侧面图像无法正常融合及肤色融合的问题,利用StyleGAN生成式对抗网络源图...

  • ENVI下的LandsatTM8影像融合

    一、图像融合 图像融合,是将低分辨率的多光谱影像与高分辨率的单波段影像重采样生成一副高分辨率多光谱影像遥感的图像...

  • Text-Guided Synthesis of Artisti

    最近,扩散模型改进了生成图像生成,从而在各种任务中获得了出色的视觉质量。随着强大的多模态模型(如CLIP)的出现,...

  • 识别物体+路径生成

    流程 截取视频 图像处理识别物体二值化物体定位 经过erode/dilate后物体轮廓偏移了 生成路径路径中的坐标...

  • 基于CycleGAN的性别变换方法

    GAN的简介 近年来,GAN(生成对抗式网络)成功地应用于图像生成、图像编辑和和表达学习等方面。最小化对抗损失使得...

  • day2,

    1.什么是路径? 实际工作中,通常新建一个文件夹专门用于存放图像文件,这时再插入图像,就需要采用“路径”的方式来指...

网友评论

      本文标题:MultiDiffusion:用于受控图像生成的融合扩散路径

      本文链接:https://www.haomeiwen.com/subject/pgmzkdtx.html