您現(xiàn)在的位置：首頁 > 資訊 > 國內 > 正文

GAN卷土重來：10億參數(shù)的GigaGAN效果堪比擴散模型_環(huán)球簡訊

時間：2023-06-16 14:53:13 來源：程序員客棧

(資料圖片僅供參考)

點藍色字關注“機器學習算法工程師”

設為星標，干貨直達！

自從 DALL·E 2 之后，在圖像生成方面擴散模型替代GAN成了主流方向，比如開源的文生圖模型stable diffusion也是基于diffusion架構的。近日， Adobe研究者在論文Scaling up GANs for Text-to-Image Synthesis提出了參數(shù)量為10億（1B）的GAN模型：GigaGAN，其在文生圖效果上接近擴散模型效果，而且推理速度更快，生成512x512大小圖像只需要0.13s，生成16M像素圖像只需要 3.66s。同時GigaGAN也支持latent空間的編輯功能，比如latent插值，風格混合，以及向量運算等。

GigaGAN

改進了StyleGAN架構，采用兩階段訓練策略：一個是64x64的圖像生成器和一個512x512的圖像超分2器，其圖像生成器架構如下所示（這里也是采用CLIP text encoder來引入text condition）：

GigaGAN

在 LAION2B-en和 COYO-700M數(shù)據(jù)集上訓練，其在COCO數(shù)據(jù)集上的FID達到9.09，超過stable diffusion 1.5，推理速度比stable diffusion快20倍多（2.9s vs 0.13s）：

GigaGAN

除了文生圖能力，還可以實現(xiàn)可控的合成，比如風格混合，如下圖所示：

更多效果圖和技術細節(jié)見論文https://arxiv.org/abs/2303.05511和網(wǎng)站https://mingukkang.github.io/GigaGAN/

關鍵詞：

上一篇：240余戶居民喜提新居青島城陽區(qū)小莊社區(qū)舉行抓鬮分房儀式|今日精選
下一篇：最后一頁

最近更新

凡本網(wǎng)注明“XXX（非汪清新聞網(wǎng)）提供”的作品，均轉載自其它媒體，轉載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點和其真實性負責。

特別關注

當前資訊!駐符拉迪沃斯托克總領館提醒領區(qū)中國公民妥善保管護照等個人證件物品

為此，中國駐符拉迪沃斯托克總領館特別提醒領區(qū)中國公民，提高安全防范

2023-06-16 14:52
首爾天氣預報40天查詢（首爾天氣預報）環(huán)球播報

1、韓國天氣預報么有穿衣指數(shù)，根據(jù)最近5天首爾天氣，除了高溫穿的短袖

2023-06-16 14:10
快看點丨魏都區(qū)城管局：優(yōu)化民生服務彰顯城管擔當

今年以來，魏都區(qū)城管局高度重視自身隊伍規(guī)范化建設，秉承“硬件是基礎

2023-06-16 13:47
觀速訊丨什么是直三棱柱（直三棱柱和三棱柱有什么區(qū)別）

想必現(xiàn)在有很多小伙伴對于直三棱柱和三棱柱有什么區(qū)別方面的知識都比較

2023-06-16 13:03
【獨家焦點】山西焦化擬將90萬噸/年焦化產能置換至山焦集團

山西焦化股份有限公司(山西焦化)6月14日公告，擬將1 、2 焦爐90萬噸年

2023-06-16 12:49
超40度高溫來襲！“燒烤”模式還要持續(xù)多久_天天熱訊

中央氣象臺6月16日06時繼續(xù)發(fā)布高溫黃色預警：預計6月16日白天，華北東

2023-06-16 12:25
山東作家‖【麥收】◆馬翔宇

剛剛送走了漫天飛舞的柳絮，又迎來了麥子的金黃。行走在黃河大堤上

2023-06-16 12:12
全球速遞！褚玉璞像銀元價格（2023年06月16日）

金投白銀網(wǎng)提供褚玉璞像銀元價格（2023年06月16日），褚玉璞銀元最新消

2023-06-16 11:57
2.5噸勞斯萊斯被吊上廈門44樓住宅安全性受質疑，樓盤和車商回應：沒問題世界報道

近日，有網(wǎng)友在多個短視頻平臺發(fā)布了一段視頻：一輛重達2 5噸的勞斯萊

2023-06-16 11:48
國資委：央企要以上市公司為平臺開展并購重組

日前，國資委召開中央企業(yè)提高上市公司質量暨并購重組工作專題會，就上

2023-06-16 11:31

熱文推薦

GAN卷土重來：10億參數(shù)的GigaGAN效果堪比擴散模型_環(huán)球簡訊

最近更新

特別關注

焦點資訊