Adding Conditional Control to Text-to-Image Diffusion Models
10 Feb 2023
Lvmin Zhang, Maneesh Agrawala
[Stanford University]
https://arxiv.org/abs/2302.05543
我们提出了一种神经网络结构ControlNet,用于控制预训练的大扩散模型,以支持额外的输入条件。ControlNet以端到端的方式学习特定于任务的条件,即使训练数据集很小(<50k),学习也很鲁棒。此外,训练ControlNet与微调扩散模型一样快,而且该模型可以在个人设备上训练。或者,如果强大的计算集群可用,该模型可以扩展到大量(数百万到数十亿)数据。我们报告称,Stable Diffusion等大型扩散模型可以通过ControlNets进行扩展,以实现边缘图、分割图、关键点等条件输入。这可能会丰富控制大型扩散模型的方法,并进一步促进相关应用。







网友评论