中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
吳恩達(dá)新年公開(kāi)推薦這個(gè)設(shè)計(jì)師,上千人點(diǎn)贊

2021年一開(kāi)始,OpenAI在GPT-3方向上的又一重要突破,讓吳恩達(dá)等大佬激動(dòng)了。

之前給GPT-3一段話,就能寫(xiě)出一段小說(shuō)。

現(xiàn)在它成功跨界——可以按照文字描述、生成對(duì)應(yīng)圖片!

簡(jiǎn)直就是“甲方克星、乙方福音”,提需求愛(ài)描述的甲方老板,現(xiàn)在直接嗶嗶就能立竿見(jiàn)影得到效果圖。

比如你輸入“OpenAI公司門(mén)面”,它就能給出設(shè)計(jì)圖:

這個(gè)新的AI,叫做DALL·E(Dali + Wall-E)。

除了生成現(xiàn)實(shí)中的圖片外,DALL·E還能按要求設(shè)計(jì)出“一顆白菜穿著芭蕾舞裙在遛狗”,妥妥的漫畫(huà)風(fēng)。

從“五邊形鬧鐘”到“牛油果形狀的座椅”,只要你的想象力夠豐富,DALL·E全都能畫(huà)出來(lái)。

技術(shù)上更厲害的是,OpenAI透露這個(gè)AI是基于GPT-3而構(gòu)建,僅使用了120億個(gè)參數(shù)樣本,相當(dāng)于GPT-3參數(shù)量的十四分之一

于是效果一出,吳恩達(dá)、Keras之父等紛紛轉(zhuǎn)發(fā)、點(diǎn)贊。堪稱2021年第一個(gè)令人興奮的AI技術(shù)突破。

看吳恩達(dá)老師pick的這個(gè)demo效果,以后是想直接描述生成自己想要的藍(lán)工裝?

“圖像版”GPT-3,還自帶排名

生成這些優(yōu)秀作品的,是一個(gè)名為DALL·E的結(jié)構(gòu)。

DALL·E的名字,來(lái)源于大藝術(shù)家達(dá)利(Dalí)和皮克斯動(dòng)畫(huà)《機(jī)器人總動(dòng)員》中的主角“瓦力”(WALL·E)。

本質(zhì)上,它就是一個(gè)被重新訓(xùn)練過(guò)的“120億參數(shù)版”GPT-3,能根據(jù)一段文字描述,生成對(duì)應(yīng)的圖像。

為了讓DALL·E能“識(shí)字畫(huà)圖”,研究者們用包含各種“文本-圖像”組合的數(shù)據(jù)集,來(lái)訓(xùn)練DALL·E。

這其中,DALL·E以單數(shù)據(jù)流的形式,一次性接收1280個(gè)字符(token),其中256個(gè)字符分配給文字,其余的1024個(gè)則分配給圖像。

DALL·E將對(duì)這些輸入信息進(jìn)行建模,利用自注意力層的注意力遮罩,確保每一個(gè)輸入的圖像字符,都與所有輸入的文字字符關(guān)聯(lián)。

然后DALL·E將根據(jù)文本,通過(guò)最大似然估計(jì),逐個(gè)字符生成圖像。它不僅能從文字中,生成一整幅草圖,還能重新生成圖像中的任何一塊矩形區(qū)域。

這就完了?

當(dāng)然沒(méi)有,我們最終看到的作品,其實(shí)只是DALL·E創(chuàng)作的一部分,即“優(yōu)秀作品選”。

也就是說(shuō),還需要一個(gè)網(wǎng)絡(luò)CLIP,來(lái)對(duì)它生成的這些作品進(jìn)行排名、打分。

越是CLIP看得懂、匹配度最高的作品,分?jǐn)?shù)就會(huì)越高,排名也會(huì)越靠前。

這種結(jié)構(gòu),有點(diǎn)像是利用生成對(duì)抗文本,以合成圖像的GAN。不過(guò),相比于利用GAN擴(kuò)大圖像分辨率、匹配圖像-文本特征等方法,CLIP則選擇了直接對(duì)輸出進(jìn)行排名。

據(jù)研究人員表示,CLIP網(wǎng)絡(luò)的最大意義在于,它緩解了深度學(xué)習(xí)在視覺(jué)任務(wù)中,最大的兩個(gè)問(wèn)題。

首先,它降低了深度學(xué)習(xí)需要的數(shù)據(jù)標(biāo)注量。相比于手動(dòng)在ImageNet上,用文字描述1400萬(wàn)張圖像,CLIP直接從網(wǎng)上已有的“文字描述圖像”數(shù)據(jù)中進(jìn)行學(xué)習(xí)。

此外,CLIP還能“身兼多職”,在各種數(shù)據(jù)集上的表現(xiàn)都很好(包括沒(méi)見(jiàn)過(guò)的數(shù)據(jù)集)。但此前的大部分視覺(jué)神經(jīng)網(wǎng)絡(luò),只能在訓(xùn)練的數(shù)據(jù)集上有不錯(cuò)的表現(xiàn)。

例如,CLIP與ResNet101相比,在各項(xiàng)數(shù)據(jù)集上都有不錯(cuò)的檢測(cè)精度,然而ResNet101在除了ImageNet以外的檢測(cè)精度上,表現(xiàn)都不太好。

具體來(lái)說(shuō),CLIP用到了零樣本學(xué)習(xí)(zero-shot learning)、自然語(yǔ)言理解和多模態(tài)學(xué)習(xí)等技術(shù),來(lái)完成圖像的理解。

例如,描述一只斑馬,可以用“馬的輪廓+虎的皮毛+熊貓的黑白”。這樣,網(wǎng)絡(luò)就能從沒(méi)見(jiàn)過(guò)的數(shù)據(jù)中,找出“斑馬”的圖像。

最后,CLIP將文本和圖像理解結(jié)合起來(lái),預(yù)測(cè)哪些圖像,與數(shù)據(jù)集中的哪些文本能完成最好的配對(duì)。

此次生成的Demo圖像,正是從512個(gè)樣本中,用CLIP選出的前32個(gè)樣本。研究人員強(qiáng)調(diào),整個(gè)過(guò)程他們?nèi)虥](méi)有參與

有哪些初步效果?

此次上線的Demo,大致分成這幾類(lèi)效果。

控制變量,修改物體的屬性(數(shù)量、顏色)。

甚至,還可以加上個(gè)年代屬性。輸入文字:電話。

那這個(gè)電話放在未來(lái)呢?竟然會(huì)是這個(gè)亞子。

同時(shí)控制多個(gè)對(duì)象。比如,戴紅色帽子,黃色手套,藍(lán)色襯衫和綠色褲子的企鵝。

說(shuō)實(shí)話,要換成是我,我一個(gè)也畫(huà)不出來(lái)。(手動(dòng)裂開(kāi))

推斷細(xì)節(jié)。正如上文舉的例子,“沐浴在朝陽(yáng)中的田間水豚”。

單從文字上看,還有很多細(xì)節(jié)需要考究:水豚位置,陰影有無(wú),繪畫(huà)風(fēng)格。但這些,似乎都沒(méi)有難倒DALL·E。

大佬們紛紛給出好評(píng)

對(duì)于OpenAI這個(gè)新鮮出爐的DALL·E,大佬們也紛紛發(fā)表了自己的看法。

Keras創(chuàng)始人@Fran?ois Chollet表示,這看起來(lái)非??幔绕涫恰皥D像生成”部分。

從原理上來(lái)看,應(yīng)該就是GPT-3在文本合成圖像方向上的擴(kuò)展版。

OpenAI的CTO Greg Brockman在轉(zhuǎn)發(fā)DALL·E后,更是立刻獲得了1.4k的贊。

英偉達(dá)的機(jī)器學(xué)習(xí)專(zhuān)家Ming-Yu Liu,也送上了自己的祝福。

他表示,這樣的模型在文本轉(zhuǎn)圖像的能力上,簡(jiǎn)直超乎想象。

當(dāng)然,也有對(duì)這種方法的限制感到困惑的學(xué)者。

來(lái)自哈佛的助理教授Tomer Ullman,在對(duì)DALL·E的能力表示驚嘆時(shí),也提出了對(duì)于模型泛化能力限制的疑惑。

他認(rèn)為,如果能生成“綠方塊上的紅方塊”,模型理應(yīng)也能生成“藍(lán)方塊上的綠方塊上的紅方塊”?

希望這樣的模型,能在提升泛化等能力后,真正被用來(lái)減輕設(shè)計(jì)師們的負(fù)擔(dān)。

當(dāng)然,如果再開(kāi)一開(kāi)腦洞的話,應(yīng)用前景可能不止于減輕負(fù)擔(dān)。

如果效果足夠好,還要什么乙方設(shè)計(jì)師?

以及像動(dòng)畫(huà)、影視等領(lǐng)域,是不是未來(lái)劇本一放,AI就能給你出成果了?

參考鏈接:
https://openai.com/blog/dall-e/
https://openai.com/blog/clip/
https://twitter.com/fchollet/status/1346558591835070464
https://twitter.com/gdb/status/1346554999241809920
https://twitter.com/liu_mingyu/status/1346573218270724097
https://twitter.com/TomerUllman/status/1346556192907255808

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
人工智能“干掉”程序員后,又對(duì)藝術(shù)家下手了
真實(shí)世界的人工智能應(yīng)用落地——OpenAI篇
多模態(tài)圖像版「GPT-3」來(lái)了!OpenAI推出DALL-E模型,一句話即可生成對(duì)應(yīng)圖像
AI 圖像生成10年,一些值得記住的論文
電廠丨社交網(wǎng)絡(luò)刷屏的AI作畫(huà),它來(lái)自達(dá)利和WALL · E
DALL·E 3關(guān)鍵技術(shù)公開(kāi)!19頁(yè)論文揭秘如何對(duì)提示詞“唯命是從”
更多類(lèi)似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服