MidJourney

2022. augusztus 11. | Egyéb

A MidJourney egy mesterséges intelligencia eszköz, amely a beírt szöveg segítségével bármilyen szerzői fantáziát képes műalkotássá alakítani.

A mesterséges intelligencia által generált képek lenyűgözőek, és mindenképp elgondolkodtatók. Látni, hogy a megfelelően megadott szavakból pillanatok alatt egy elképesztő mű születik, sok kérdést vet fel. Az elmúlt néhány évben a gépi tanulási rendszerek képalkotási képessége szöveges utasításokból drámaian megnőtt minőségben, és most már egy átlag felhasználó is hozzáférhet az ilyen digitális mű elkészítésének lehetőségéhez. Persze nem tökéletes. Még. Meg egyébként is mi a tökéletes? És ez csak a kezdet, az AI folyamatosan tanul, és egyre jobb lesz.

Képzeld el, hogy lakásodba CEWE fali dekorációkat tervezel, pár szóval megadod a színeket, stílust, témát, arányokat, bármit, és percek alatt lesz egy pont olyan képed, amit elképzeltél a szobád falán.

Hogy fogalmad sincs, mit írj be? Nem gond, inspirálódhatsz a többiek alkotásából. Hogyan?

Az 1. lépés, hogy katt a MidJourney oldalára. Ezt fogod látni:

2. regisztrálni kell a Discord-ra, ugyanis a MidJourney platformja a Discordon keresztül működik. A Discord egy ingyenes hang-, videó- és szöveges csevegőalkalmazás, ami talán itthon nem annyira ismert. A Sign In with Discord-ra kattintva tudsz regisztrálni.

Ezt még engedélyezni kell:

Itt találod majd a műveidet.

A Community Feed-del meg mások munkáit tudod megnézni.

Ha már megvan a Discord regisztráció, a Join the beta visz arra a felületre, ahol alkotni tudsz.

Bal oldalt kell a MidJourney ikonjára kattintani:

Szintén bal oldalt különböző csatornák vannak, hazudnék, ha azt mondanám, hogy mindent értek ebből, de hidd el, anélkül is lehet alkotni:) (Ha mindenre rájöttem, frissítem a cikket.:)) A lényeg, hogy kell keresni egy #newbies csatornát. Alul kezdd el beírni a /imagine parancsot, és észre fogod venni, hogy a szöveged fölött felugrik valami.
Katt a /imagine opcióra: a prompt mező létrejön, és most már bármit hozzáadhatsz, amiből szeretnéd, hogy a bot generáljon.

Tény, hogy angolul kell megadni, de ha írsz egy listát, pl. a DeepL (szintén AI-s) gyorsan lefordítja.

Ez egy chat, szóval látod a többiek beírását is, így kicsit idegesítő módon lehet, hogy lejjebb kell tekerni, hogy megtaláld a sajátodat. A kép a szemed láttára alakul ki, jelzi is, hogy hány százalékon áll.

Ha elkészült, négy variációt látsz, és két sor gombot.

A felső sorban: U1, U2 , U3 , U3 és U4 gombok a kiválasztott kép felméretezéséhez valók. Alapértelmezés szerint ez további részleteket is generál. Bal felső kép az U1, mellette U2 stb.

Az alsó sorban: V1, V2 , V3 , és V4 gombok a kiválasztott kép variációinak létrehozására. Ha nem tudsz dönteni ezekből, kiválaszthatod melyik tetszik legjobban, és abból újabb négy variációt hoz létre.

Ha már tetszik a kép, elég csak nagyobb méretben legenerálni. Nekem először kb. 1600 x 1600-as képet készített, amit aztán a Topaz Gigapixel AI-vel óriásira nagyítottam.

Sajnos az újabb variációk és a felnagyítás is újabb bejegyzésben lesz, szóval mindig meg kell keresni, hogy hol is van a te képed.

Erre és másra is csak az a megoldás, ha fizetősre térsz át. Havi díjas, de természetesen lehet csak egy hónapra előfizetni. A 10 $-os verzióban kb. 200 képet lehet készíteni. Azért kb, mert nem darabot számolnak, hanem GPU munkáját számítja percekben, és azt kell megfizetni.

Ha előfizetsz, akkor a saját csatornádon tudod a képeket generálni, és nem kell állandóan keresgélni, hogy a többi kép között hol van a tiéd.

Nagyjából ennyit kell tudni erről. A többi már csak a próbálkozás, kísérletezés. A többiek munkájából elleshetsz szavakat, vagy beírhatsz bármit, aztán majd kiderül, mi lesz belőle. Alapértelmezetten négyzetes lesz a végeredmény, ha mást szeretnél, akkor azt is be kell írni a prompt mezőbe. Például ezt írtam:

summer, Austrian mountain, lake in between tall mountains, wood cottage::1.8 lush forest, pine trees, photorealistic, highly detailed, cinematic lighting, god rays –ar 2:1

Vagyis, nyár, osztrák hegy, tó, faház, fenyőfa, stb. és a végén az ar 2:1 jelenti a képarányt. Ezt a négy variációt ajánlotta fel:

A 3. képet méreteztem fel, ezzel részletesen kidolgozza a képet.

Nem feltétlen minden hibátlan, ott is van faház, ahol nem kellene. Ha valami nem tetszik, utómunkával lehet javítani, de így is lenyűgöző. Többek között ilyeneket sikerült készíteni:

És pár azok közül, ahol még csak a 4 kidolgozatlan variáció látszódik.

Semmiképp nem lehet összevetni egy jó fotóval, hiába írod be, hogy fotó-realisztikus és nagyon részletes legyen, nem lesz az. És grafikaként is vannak furcsaságai. Ha ránézel erre a képre, akkor látsz egy motorost, aki halad a naplemente felé. Mert ezt sugallja a kép, illetve az agyunk ezt látja benne. Aztán, ha közelebbről megnézed, nincs a motornak egy eleme sem, ami beazonosítható lenne. Még kereke sem nagyon. Itt-ott fura izék lógnak rajta, nem tudni mik. Az ember lába sem nagyon kivehető, szóval egyelőre még az ember alkotta mű a jobb, és azért remélem, hogy így is marad. Sokat kell gyakorolni, hogy kiderüljön, mit hogy értelmez az AI, és nyilván idővel egyre jobb lesz.

A legjobb némi Photoshop-pal vegyíteni, itt például egy igazi arc fotója került rá.

MidJourney

Bejelentkezés

0 hozzászólás

Egy hozzászólás elküldése