久久无吗视频 I 少妇性l交大片7724com I 在线免费观看污网站 I 一二区视频 I 男女免费视频 I 日本高清免费aaaaa大片视频 I 久色网站 I 玖玖综合色 I 日皮的视频 I 麻豆成人在线 I 伊人春色在线 I 中文字幕制服诱惑 I 欧美亚一区 I 三级亚洲 I 香蕉在线视频观看 I 99久久精品国产色欲 I 韩国一区二区视频 I 久草福利视频 I 高清视频一区二区三区 I 国产成人午夜高潮毛片 I 国产欧美日韩高清 I 欧美国产精品日韩 I 超内碰在线 I 成人免费ā片在线观看 I 欧美成人精品三级在线观看 I 久久色成人在线 I 欧美国产日韩亚洲中文 I 亚洲 欧美 偷拍 卡通 变态 I 最新国产成人在线观看 I 九一黄色片 I 精品国产精品亚洲一本大道 I 亚洲视频在线视频观看视频在线 I 亚洲精品国产欧美一二区 I 少妇伦子伦精品无吗在线观看 I 毛片播放器 I 国产男女猛烈无遮挡在线喷水 I 国产成人精品日本亚洲语音 I 欧美操日韩 I 九九九伊在人

您現(xiàn)在的位置:首頁 > 資訊 > 國內 > 正文

GAN卷土重來:10億參數(shù)的GigaGAN效果堪比擴散模型_環(huán)球簡訊

時間:2023-06-16 14:53:13    來源:程序員客棧    


(資料圖片僅供參考)

點藍色字關注“機器學習算法工程師”

設為星標,干貨直達!

自從 DALL·E 2 之后,在圖像生成方面擴散模型替代GAN成了主流方向,比如開源的文生圖模型stable diffusion也是基于diffusion架構的。近日, Adobe研究者在論文Scaling up GANs for Text-to-Image Synthesis提出了參數(shù)量為10億(1B)的GAN模型:GigaGAN,其在文生圖效果上接近擴散模型效果,而且推理速度更快,生成512x512大小圖像只需要0.13s,生成16M像素圖像只需要 3.66s。同時GigaGAN也支持latent空間的編輯功能,比如latent插值,風格混合,以及向量運算等。

GigaGAN改進了StyleGAN架構,采用兩階段訓練策略:一個是64x64的圖像生成器和一個512x512的圖像超分2器,其圖像生成器架構如下所示(這里也是采用CLIP text encoder來引入text condition):GigaGAN在 LAION2B-en和 COYO-700M數(shù)據(jù)集上訓練,其在COCO數(shù)據(jù)集上的FID達到9.09,超過stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生圖能力,還可以實現(xiàn)可控的合成,比如風格混合,如下圖所示:更多效果圖和技術細節(jié)見論文https://arxiv.org/abs/2303.05511和網(wǎng)站https://mingukkang.github.io/GigaGAN/
關鍵詞:
相關新聞

最近更新

凡本網(wǎng)注明“XXX(非汪清新聞網(wǎng))提供”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和其真實性負責。

特別關注