DALL·E

2022. november 3. | Egyéb

A Midjourney korábban már témája volt a blognak, egy mesterséges intelligencián alapuló eszköz, mely szavak megadásából alkot képeket.

MidJourney

A DALL·E tulajdonképpen ugyanezt teszi. Korábban várólista volt, hogy ki lehessen próbálni, én már annyit vártam rá, hogy közben ez a korlátozás meg is szűnt, és mindenki regisztrálhat.
Természetesen nem tökéletesen azonosan működik a kettő, vannak különbségek. A Midjourney inkább digitális műalkotásokat hoz létre, a képekre leginkább a fantasy stílus jellemző, míg a DALL·E fotórealisztikus képeket készít, és képes elemeket hozzáadni vagy eltávolítani egy betöltött fotónál. Az árképzése is más a kettőnek. A MJ előfizetéses, a DALL·E kreditekkel dolgozik.

Azonos szavak beírására teljesen különböző eredményt kapunk.

A szöveg ez volt: autumn botanical paintings, dainty petals, sweet air. white background, beautiful. Ez lett a DALL·E-vel:

És ez a MJ-vel:

Belátható, hogy művészi szempontból a Midjourney lényegesen jobb.

De nem is erről lesz most szó, hanem arról, hogy mi az, amiben a DALL·E a jobb. Pontosabban, amit a DALL·E tud, a MJ meg nem.

Regisztrálni itt tudsz. Az első hónapban 50 ingyenes kredit jár, utána csak 15, de persze vásárolni lehet.

A DALL·E szuperül tud eltüntetni és hozzáadni dolgokat egy fotóhoz. Ha csak egyszer is szükséged van erre, már érdemes kipróbálni.

Itt van például ez a fotó. Nyilván nem jellemző, hogy pont a témát akarnánk eltüntetni, de azt azért jól szemlélteti, hogy sem a clone eszköz, sem a content-aware fill nem sokra menne vele.

Bár a DALL·E-ben is meg lehet határozni egy ecsettel, hogy mi helyett akarunk mást, Photoshop-ban egyszerűbb és pontosabb kijelölés végezhető. Így ezt töltöttem be, a kislányt kivágtam a képről, a terület átlátszó lett.

A DALL·E sajnos négyzetesen szerkeszt, és csak 1024 x 1024 pixel méretben, de ezt azért lehet orvosolni. A vágás azon a részen van, amit korrigálni kell.

Ilyen variációk születtek:

Legjobban ez tetszett:

Utána ezt csak rá kell illeszteni az eredeti képre, ha szükséges, kicsit felnagyítva. Az esetleges hibákat könnyen lehet korrigálni.

Vagy itt van ez a kép. Valamikor ezt már manuálisan kiretusáltam, elég sok időbe telt.

Kivágtam a rossz részt.

A DALL·E ezeket ajánlotta fel:

Utána a PS Photo Restoration neural szűrő, és ilyen lett (töredék idő alatt):

Az ilyen típusú fotókból van a legtöbb:

Zavaró a turisták jelenléte, de mivel mindig jönnek újabbak, nehéz kivárni, míg mindenki elmegy. Itt is először a törlés:

Majd még kellett egy kis javítás, így a DALL·E-ben is jelöltem még az első eredmény után:

Végül ez is szuper lett:

Előfordulhat olyan eset is, amikor dupla oldalon vagy borítón használnánk egy fotót, és nem elég a szélessége. Nyilván ne „kérjük” az Eiffel torony mellé a Taj Mahal-t, de valami semleges bővítés nem hamisítja meg a valóságot.

Csak egy kis bokrot és virágot kértem. Szuper, hogy még a mélységélesség tekintetében is figyelembe veszi a környezetet.

Egy másik fotóval:

Eredmény:

Tökéletesen folytatta a félbevágott virágot is. Jó, a valóságban valószínűleg nincs ott az a másik hegyvonulat, de nem is az a lényeg:)

Kipróbáltam ezen a fotón is:

Ez persze már nem ajánlott, hisz nyilván nem az a házrészlet kerül oda, ami a valóságban van, de kíváncsi voltam, hogy mire megy vele. Folytatta a bejáratot és az ablakot is, és kitöltötte egy épülettel, ami jól illeszkedik a környezetébe.