Körülbelül másfél éve írtam utoljára a MidJourney-ról, és azóta hatalmas fejlődésen ment keresztül ez az AI-alapú képgeneráló eszköz.
Mivel mi itt a fotókönyv szerkesztéssel foglalkozunk, leginkább azt nézzük meg, hogy milyen grafikákat generálhatunk, melyekkel színben és hangulatban jól kiegészíthetjük a képeket.
Korábban kizárólag a Discord platformon keresztül lehetett képeket létrehozni, az előző cikkekben ezt mutattam be. Most azonban a MidJourney saját webes felületén kényelmesen hozzáférünk a legújabb funkciókhoz, mindenféle bonyolult beállítás nélkül. A weboldal új keresési és rendezési eszközei pedig gyorsabbá és áttekinthetőbbé teszik a munkát.
Az Explore menüpontban böngészheted a más felhasználók által készített képeket, és inspirációt meríthetsz különböző témákból. A kereső segítségével találhatsz konkrét stílusú és hangulatú képeket. Ha valamelyik tetszik, annak promptját felhasználhatod, hogy a saját, hasonló stílusú képedet létrehozd. Amikor az adott kép fölé viszed az egeret, több ikon jelenik meg, amelyekkel kiválaszthatod a prompt használatát, vagy szerkesztését is.
Azt azért jó tudni, hogy még ha ugyanazt a promptot használod is, a generált kép sosem lesz teljesen azonos az eredetivel. Az AI minden generálásnál új variációkat hoz létre, így a kész képek mindig egyediek maradnak, még ha hangulatukban vagy részleteikben hasonlóak is.
A Create mező az a hely, ahol megadhatod – angolul – hogy pontosan milyen képet szeretnél látni. Ha az angol nem megy, bármelyik online fordító segíthet. Megírhatod a stílust, a színeket, a képarányt és sok más részletet is, hogy pontosan a kívánt grafikát kapd. (Aztán vagy azt kapod, vagy nem.)
Például kérhetsz fehér hátteret, hogy könnyebb legyen elválasztani a grafikáról. Fehér háttér különösen hasznos grafikák esetében, mivel később könnyebb eltávolítani vagy más háttérrel kombinálni. A képarány megadásához használhatod a --ar paramétert, pl. –ar 2:3 A négyzetes forma az alapértelmezett, ahhoz nem kell semmit beírni.
A prompt beállításával játszhatsz a színekkel is, mint például muted greens (visszafogott zöldek) vagy earthy browns (földes barna árnyalatok), hogy a kívánt színvilágot kapd. Még jobb, ha beraksz egy fotót inspirációnak.
Egy Rovinjban készült fotómat tettem be, hogy a hangulatot és színvilágot onnan vegye le. Egész biztos, hogy Rovinjban nem pont ilyenek a házak, de attól még tökéletes egy fotókönyv borítójához.
Korábban volt egy részletes cikk a MidJourney-ról, mindenképp azzal kellene kezdeni, ha még nem hallottál róla. Pontos leírást találsz az első lépésekről.
Akit érdekel a téma, millió videót, leírást találhat, ezekkel nem nagyon tudnék versenyezni, mert én is csak próbálkozom, és lesem a „nagyokat”. Már az 5-ös verziónál tartunk, és elképesztő a fejlődés, amit rövid idő alatt elértek az AI-val.
Az alkalmazás képes olyan részletes képeket létrehozni, amelyek valósághűen ábrázolják a leírt helyszínt vagy tájat. A generált képeken a színek, a textúrák, a forma, a különböző elemek rendkívül részletesek és valósághűek lesznek.
Az AI képalkotó alkalmazások persze nem tökéletesek, és vannak korlátaik. Csak azokat a képeket tudják generálni, amelyek az előre meghatározott képi elemekre és szabályokra épülnek.Nem rendelkeznek emberi kreativitással vagy érzelmi intelligenciával, és nem képesek a képi tartalom környezetfüggő értelmezésére vagy az emberi érzékszervek által érzékelt részletek precíz reprodukálására. Majd erre is mutatok vicces példát, de kezdjük inkább a jóval:)
Ez a kép még a 3-as verzióval készült:
Ez a 4-essel (teljesen azonos leírással):
És ez a jelenlegivel:
Vagy ez volt az előző verzióval egy vegetáriánus ételfotó:
A Midjourney korábban már témája volt a blognak, egy mesterséges intelligencián alapuló eszköz, mely szavak megadásából alkot képeket.
A DALL·E tulajdonképpen ugyanezt teszi. Korábban várólista volt, hogy ki lehessen próbálni, én már annyit vártam rá, hogy közben ez a korlátozás meg is szűnt, és mindenki regisztrálhat. Természetesen nem tökéletesen azonosan működik a kettő, vannak különbségek. A Midjourney inkább digitális műalkotásokat hoz létre, a képekre leginkább a fantasy stílus jellemző, míg a DALL·E fotórealisztikus képeket készít, és képes elemeket hozzáadni vagy eltávolítani egy betöltött fotónál. Az árképzése is más a kettőnek. A MJ előfizetéses, a DALL·E kreditekkel dolgozik.
Azonos szavak beírására teljesen különböző eredményt kapunk.
A szöveg ez volt: autumn botanical paintings, dainty petals, sweet air. white background, beautiful. Ez lett a DALL·E-vel:
És ez a MJ-vel:
Belátható, hogy művészi szempontból a Midjourney lényegesen jobb.
De nem is erről lesz most szó, hanem arról, hogy mi az, amiben a DALL·E a jobb. Pontosabban, amit a DALL·E tud, a MJ meg nem.
Regisztrálni itt tudsz. Az első hónapban 50 ingyenes kredit jár, utána csak 15, de persze vásárolni lehet.
A MidJourney egy mesterséges intelligencia eszköz, amely a beírt szöveg segítségével bármilyen szerzői fantáziát képes műalkotássá alakítani.
A mesterséges intelligencia által generált képek lenyűgözőek, és mindenképp elgondolkodtatók. Látni, hogy a megfelelően megadott szavakból pillanatok alatt egy elképesztő mű születik, sok kérdést vet fel. Az elmúlt néhány évben a gépi tanulási rendszerek képalkotási képessége szöveges utasításokból drámaian megnőtt minőségben, és most már egy átlag felhasználó is hozzáférhet az ilyen digitális mű elkészítésének lehetőségéhez. Persze nem tökéletes. Még. Meg egyébként is mi a tökéletes? És ez csak a kezdet, az AI folyamatosan tanul, és egyre jobb lesz.
Képzeld el, hogy lakásodba CEWE fali dekorációkat tervezel, pár szóval megadod a színeket, stílust, témát, arányokat, bármit, és percek alatt lesz egy pont olyan képed, amit elképzeltél a szobád falán.
Hogy fogalmad sincs, mit írj be? Nem gond, inspirálódhatsz a többiek alkotásából. Hogyan?
Az 1. lépés, hogy katt a MidJourney oldalára. Ezt fogod látni:
A Deep Dream Generator egy ingyenes webes alkalmazás, amellyel mesterséges intelligencia segítségével készíthetsz műalkotásokat. Nos, ebből a mondatból két kijelentés sem igaz feltétlen:) Az egyik, hogy ingyenes. Mert van fizetős változata is, de egész biztos vagyok benne, hogy pár próbálkozásra bőven elég az ingyenes verzió. A másik, hogy ez műalkotás lenne. 🙂 Mondjuk inkább azt, hogy érdekes képeket lehet vele készíteni. Az utóbbi időben megugrott a mesterséges intelligencia által generált „művészet”. Ez valószínűleg annak köszönhető, hogy a mesterséges intelligencia területe ma már szélesebb körben ismert és elfogadott. A Deep Dreaming, vagyis a gépi tanulás algoritmusainak használata álmok generálására, a Google mérnökei által létrehozott AI egy izgalmas formája. Ezen az oldalon éred el.
Regisztráció után a „Generate” gombra kell kattintani. A lépések nagyon egyszerűek, a végeredmény meg teljesen kiszámíthatatlan.
Choose base image. Itt kell az alapképet kiválasztani.
Choose style image, itt pedig a stílust, ha valamilyen saját képpel ötvöznéd. Ha nem, akkor választhatsz az alapértelmezettek közül, vagy a Popular styles-ra kattintva még több népszerű stílus jelenik meg.
A kis fogaskerék a beállításokhoz vezet. Itt tulajdonképpen csak a „Preserve Colors”-t érdemes be- vagy kikapcsolni, ami az eredeti fotó színeinek megőrzését jelenti. A nagyobb felbontás már a fizetős verzióhoz tartozik. Van még az a kis villámjel, ami az „energiádat” mutatja, ami egy pár idő után elfogy, és valamennyi időt kell várni ahhoz, hogy feltöltődjön, és ismét lehessen képeket generálni.
Ahogy írtam, kiszámíthatatlan a végeredmény, de izgalmas várni, hogy milyen is lesz:) Itt ezt a két képet választottam:
A Darktable egy nyílt forráskódú képfeldolgozó és kategorizáló program. Ingyenes és magyarul is tud. Letölteni innen lehet Windows, Mac és Linux változatban is.
Nemrég jött ki a 2.6-os frissítés, sok újdonsággal, bár mivel itt még nem foglalkoztunk vele, minden új benne:) Aki nem szán rá pénzt, hogy fizetős alkalmazásokat használjon, azoknak kiváló lehetőség ennek a programnak a használata.
Először be kell importálni képeket vagy mappákat. Aki használt már Lightroom-ot, annak ez nem lesz ismeretlen. Tehát: Importálás.
Megjelennek a képek, a bal oldalon minden infót láthatunk, a jobb oldalon megadhatjuk az exportálási beállításokat.
Weboldalunk működtetéséhez cookie-kat használunk, amelyek hozzájárulnak az oldal Önre történő optimalizálásához és folyamatos fejlesztéséhez, valamint az Önt érdeklődésének megfelelő hirdetések megjelenítéséhez. Az "Összes elfogadása" gombra kattintva elfogadja ezek alkalmazását. A "További lehetőségek" gomb segítségével kiválaszthatja, melyeket kívánja engedélyezni. További információ az Adatkezelési tájékoztatóban található.
Alapvető
Always active
Az oldal működéséhez feltétlenül szükséges elemek.
Preferences
The technical storage or access is necessary for the legitimate purpose of storing preferences that are not requested by the subscriber or user.
Statisztikai
Az oldal látogatottságának mérésére szolgáló statisztikai célú adatok.The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.