Github – Borisdayma/Dalle -Mini: Dall · E mini – képeket generál egy szöveges üzenetből, hogyan működik a dalle -mini?

Hogyan működik a Dalle-Mini

.

Elmentett keresések

Használja a mentett kereséseket az eredmények gyorsabb szűrésére

Bejelentkezett egy másik fülkel vagy ablakkal. Töltse le újra a munkamenet frissítéséhez. Jelentkezett egy másik lapon vagy ablakon. Töltse le újra a munkamenet frissítéséhez. A fiókokat egy másik lapon vagy ablakon váltotta. .

Dall · e mini – képeket generáljon egy szöveges üzenetből

Ez az elkötelezettség nem tartozik a tároló egyik ágához, és a raktáron kívüli villához tartozik.

Név már használatban van

A címke már létezik a megadott ágnévvel. Sok GIT parancs elfogadja mind a címkét, mind az ágnevet, így ennek az ágnak a létrehozása váratlan viselkedést okozhat. Biztosan szeretné létrehozni ezt az ágot?

  • Kápakiak

Használja a GIT -t vagy a Checkout -ot az SVN -vel a web URL segítségével.
. .

Jelentkezzen be a szükséges

Kérjük, jelentkezzen be a CodeSpaces használatához.

A GitHub Desktop elindítása

Ha semmi sem történik, töltse le a GitHub Desktop -ot, és próbálja újra.

A GitHub Desktop elindítása

Ha semmi sem történik, töltse le a GitHub Desktop -ot, és próbálja újra.

Az Xcode elindítása

.

A kódjele egyszer kinyílik, ha készen áll.

.

Legújabb kötelezettségvállalás

Git statisztika

Nem sikerült betölteni a legfrissebb kötelezettségvállalási információkat.

Legfrissebb kötelezettségvállalási üzenet

2021. november 30. 04:14

Rátyol.

Dall · e mini

Hogyan kell használni?

Használhatja a modellt a ��️ crayonon

Hogyan működik?

  • Dall · e mini – képeket generáljon bármilyen szövegbejuttatásból
  • Dall · E MEGA – Képzési folyóirat

Fejlesztés

Függőségi telepítés

Csak a következtetéshez használja a PIP Install Dalle-Mini-t .

A fejlesztéshez klónozza a repo -t, és használja a PIP install -e -t “. . A PR készítése előtt ellenőrizze a stílust a Make Style segítségével .

Kísérletezhet a csővezetékkel lépésről lépésre a következtetési csővezeték notebookunkon keresztül

Dall képzése · e mini

A sweep konfigurációs fájlt is beállíthatja, ha hiperparaméter -keresést kell végrehajtania.

GYIK

?

  • Dall · e mini vagy dall · e mega képek előállítása egy szöveges üzenetből

Az Openai a “Avokádó alakú karosszéket az avokádó formájában” használta, amikor a dall · e -t felszabadította a modell képességeinek szemléltetésére. .

Csatlakozzon a közösséghez a Laion Discordon. Bármilyen hozzájárulást üdvözölünk, a jelentési kérdésektől a javítások/fejlesztések javaslatáig vagy a modell hűvös utasításokkal történő teszteléséig!

  • Szabadítsa ki a saját alkalmazását a Dall-E Playground Repository-val (köszönöm Szahar)
  • Próbálja ki a Dall · E Flow projektet a hurok-hurok-munkafolyamat előállításához, diffúziójához és fellendüléséhez (köszönöm Han Xiao)
  • futtassa a replikátumot, a böngészőben vagy az API -n keresztül

Elgondolkodások

  • �� Az arc átölelése a len/jax közösségi hét megszervezéséhez
  • A Google TPU Research Cloud (TRC) program számítási erőforrások biztosításához
  • Súlyok és elfogultságok az infrastruktúra biztosításához a kísérletkövetéshez és a modellkezeléshez

A dall · e mini -t eredetileg a következők fejlesztették ki:

  • A Dalle-Pytorch és az Eleutherai közösségek hűvös ötletek tesztelésére és cseréjére
  • Rohan Anil az elosztott sampon optimalizáló hozzáadásáért, és mindig nagyszerű javaslatokat ad
  • Phil Wang sok hűvös megvalósítást nyújtott a transzformátor variánsokról, és érdekes betekintést nyújt az X-transzformátorokkal
  • Katherine Crowson a szuper kondicionáláshoz

Ha a Dall · e mini hasznosnak találja a kutatásában, vagy hivatkozni kíván, kérjük, használja a következő BiBTEX bejegyzést.

 

Referenciák

  • “Deepnet: A transzformátorok méretezése 1000 rétegre”
  • “Swin Transformer: Hierarchikus Vision Transformer váltott ablakokkal”
  • “Cogview: A szöveg-képtermelés elsajátítása a Transformers-en keresztül”
  • “A gyökér átlag négyzetréteg normalizálása”
  • “Sinkformers: Transzformátorok, kétszer sztochasztikus figyelemmel”
  • “Alapítványtranszformátorok

@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, url= > 
 @misc< title=, author=, year=, eprint= archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@InProEedings< title=, author=, booktitle=, year= > 
@misc< title = , author = , year = , eprint = , archivePrefix = , primaryClass = > 
< title = , author = , year = , eprint = , archivePrefix = , primaryClass = > 
@misc< title = , url = , author = , publisher = , year = , > 
< title = , url = , author = , publisher = , year = , > 
@misc< title = , url = , author = , publisher = , year = , > 

Dall · e mini – képeket generáljon egy szöveges üzenetből

Hogyan működik a Dalle-Mini?

A Dalle Mini egy ingyenes, nyílt forráskódú AI, amely csodálatos képeket készít a szöveges bemenetekből. Így működik.

2022. június 15. • 4 perc olvasás

Hogyan működik a Dalle-Mini?

Biztos vagyok benne, hogy olyan képeket látott, mint a Twitter -hírcsatornában az elmúlt napokban. Ha azon tűnődött, hogy mi voltak, akkor képeket készítenek egy AI nevű DALL · E MINI. Ha még soha nem látta ezeket, el kell olvasnia ezt a cikket, mert hiányzik. Ha kíváncsi vagy, hogy ez lehetséges, nos, akkor a tökéletes cikkben van, és kevesebb, mint öt perc alatt megismeri a választ.

Ennek a névnek, a Dall · E -nek már csengőnek kell lennie, mivel az Open AI által az elmúlt évben készített modell két verzióját hihetetlen eredményekkel fedeztem fel. De ez más. .

.
A link az alábbi referenciákban található, de adja meg még néhány másodpercig ezt a cikket, mielőtt vele játszik. Megéri, és sokkal többet fog tudni erről az AI -ről, mint mindenki, akit ismersz körülötted.

A lényeg a Dall · e mini nagyon hasonló a Dall · e -hez, tehát a modell kezdeti videója nagyszerű bevezetés ennek. Két fő alkotóeleme van, amint azt gyanítja, egy nyelvet és egy képmodult.

Először meg kell értenie a szöveges parancsot, majd képeket generál, két nagyon különböző dolog, amely két nagyon különböző modellt igényel. . Itt van egy BART nevű nyelvmodellünk. A BART egy olyan modell, amelynek célja a szöveges bemenetek átalakításának átalakítása a következő modell számára érthető nyelvgé. Az edzés során pár képalapú képaláírást adunk a dall · e mini -hez. A BART átveszi a szöveges feliratot, és diszkrét tokenekké alakítja, és azt a generált kép és a bemenetként elküldött kép közötti különbség alapján állítjuk be.

? Ezt dekódernek hívjuk. . .

Röviden: a vqgan nagyszerű építészet az ellenkezőjéhez. . Amint azt gyanítja, a GPT-3 és más nyelven generáló modellek nagyon hasonló dolgot csinálnak, szöveget kódolva és az újonnan generált feltérképezés dekódolása egy új szövegbe, amelyet visszaad. Itt ugyanaz, de a pixelekkel egy képet alkotó betűk helyett mondatot alkotnak. .

. Hasonlóképpen, általában csak egy kis zajt adunk ezeknek a kódolásoknak, hogy új képet generáljunk, amely ugyanazt a szöveges parancsot képviseli.

És voilà! Így tanulja meg a mini képeket a szöveges feliratokból képeket generálni.

További eredmények megtekintése a videóban:

Mint már említettem, nyílt forráskódú, és azonnal játszhatsz vele, a Huggingface-nek köszönhetően. Természetesen ez csak egy egyszerű áttekintés volt, és kihagytam néhány fontos lépést az érthetőség érdekében. . Nemrégiben két rövid videót tettem közzé a YouTube -on, amelyek néhány vicces eredményt mutatnak be, valamint összehasonlító eredményeket a Dall · e 2 -vel ugyanazon szöveg -felszólításhoz.

Nagyon jó látni!

Remélem, tetszett neki ez a cikk és a videó, és ha igen, kérjük, szánjon néhány másodpercet, hogy tudassa velem a megjegyzésekben, és hagyjon hasonlóan.

Látni foglak, nem a jövő héten, de két hét múlva egy másik csodálatos papírral!

►https: // diszkréció.gg/tournaitogether

Iratkozzon fel még ilyenre.

Az LLM -ek adaptálása konkrét feladatok elvégzéséhez!

Az LLM -ek adaptálása konkrét feladatok elvégzéséhez!

Mvdream: élethű 3D -s modellek létrehozása szavakból

MVDREAM: Új szöveg-3D megközelítés (magyarázva)!

Az AI mély tanulás elmagyarázta

Dall-e mini

A Dall-E 2 úttörő kutatás az Openai-tól, amely a technológia velejáró ígéretét követi: lehetővé téve a normál emberek számára, hogy megszerezzék a tehetséges és gazdagok szuperhatalmait. A legtöbb embernek nincs képessége vagy tehetsége a rajzoláshoz. Azoknak, akiknek csak nem lehet pénze, szakembereket bérelhetnek. .

Hotpot..

Dalle-mini

.

AI fejlövő generátor

. . Tökéletes a közösségi média profilokhoz, társkereső alkalmazásokhoz, LinkedIn profilokhoz, vagy egyszerűen csak új módon látja magát.

AI művészet

. .

Az NVIDIA, a Google, a Stabilitás úttörő kutatása alapján.AI és Openai, ezek az AI képmodellek megérthetik az egyszerű utasításokat és képeket készítenek – hasonlóan ahhoz, hogy az emberi művészek hogyan kapnak utasításokat a mecénásoktól. De vajon ez a művészet vagy akár az intelligencia?

Rövid válasz: Nem számít, hogy ezek a termékek tükrözik -e a művészetet vagy az intelligenciát. Az az számít, hogy segítenek az embereknek. Segíthet -e az AI a képzeletének valósággá változtatni, és mosolyt hozhat az arcába, vagy talán az áru alapjává válhat, hogy eladja a Shopify -ot, vagy segítsen a következő album borítójának létrehozásában?

További gondolatok az AI művészetről.