Az utóbbi időben sok – és egyre több – bejegyzés szól arról, hogyan segíthet az AI a képszerkesztésben. Jó ez? Kell ez? Szabad ezt? Érdemes ezt? Hogy ne kelljen minden cikk előtt újra lefutni ugyanazokat a köröket, összeraktam egy hivatkozási alapot. Ide mindig vissza lehet nyúlni. A fotókönyv és a scrapbook világa eleve kreatív terep. Nálunk nem megtévesztés a cél, hanem az, hogy az emlékeinket szebben, kerekebben meséljük el. Ha a háttérben ott virít egy kuka, miért maradjon? Ha egy felhő vagy egy kis fény jobb hangulatot ad, miért ne tennénk rá? Közben fontos látni a határokat is. Más szabályok vonatkoznak egy családi albumra, és megint mások egy sajtófotóra, ahol minden részlet számíthat.
A kép „alakítása” a fotó születésével indult. Jó példa rá Oscar G. Rejlander 1857-es „Two Ways of Life”-ja: több tucat negatívból rakott össze egy egyetlen, nagy ívű jelenetet. Akkor is vitáztak róla, művészet-e vagy csalás, mégis klasszikus lett.

A 20. században jött a politika. A szovjet propaganda előszeretettel retusált képeket: Trockij egyre több fotóról „tűnt el”. A nézők többsége nem vette észre, mert a cél a hihető kép volt, nem a látványos trükk.

Tanulság: a manipuláció régi, az eszköz új. Ma az AI gyors és bárki számára elérhető, ezért fontosabb a keret: mikor kreatív eszköz, és mikor válik félrevezetéssé.
Az AI-val tehát nem maga a manipuláció jelent meg, hanem a tempó és a egyszerűség: ami régen napokig tartott a sötétkamrában vagy később akár a Photoshopban órákig, ma másodpercek kérdése, és bárki megteheti, különösebb szaktudást sem igényel. Egy kattintás a Generative Fill vagy a Generative Expand gombokra, és máris kész a háttércsere, a kibővített kompozíció, a „hihető” részletpótlás. Ezért lett fontos: mikor kreatív eszköz a történethez és mikor félrevezető. Mi a képekkel nem csak „javítunk”, hanem alkotunk is. Egy scrapbook oldalon történetet mesélsz: ha a gyerekedet egy mesébe helyezed senkit nem vezetsz félre. Csak pár példa, hogy mire is lehet vagy érdemes használni: szélesebb kép kell, mondjuk egy erdő a környezet. Lesz még így pár fa, senki nem fog reklamálni, hogy az tényleg ott volt?
Kétféle zavaró dologgal találkozunk. Az első az „alkalmi” kategória: ha egy perccel később kattintunk, simán eltűnhetett volna az a parkoló autó, a kuka, vagy az a pár idegen, aki belesétált. Ezeket nyugodtan vedd le, hiszen csak azt hozod vissza, amit amúgy is megoldott volna az időzítés. A másik a „mindig ott van” típus: kábelek, oszlopok, táblák, és hasonlók. Ezek a valóság részei, de ritkán szolgálják a képet; ha elviszik a figyelmet a témáról, nyugodtan szedd le őket. Fotókönyvben és scrapbookban a fókusz az emléken van, nem a közműveken.
Érdekességként: a „Rhein II” a világ egyik legdrágább fotója; 2011-ben 4,34 millió dollárért kelt el. A 1999-es nagyítás mérete az árverésen 185,4 × 363,5 cm volt. Andreas Gursky az összes kerékpárost, kutyasétáltatót, sőt a háttér ipari épületeit eltávolította, hogy tiszta, sávos tájkép maradjon. Szerintem ő sem gondolta, hogy ilyen hatást fog elérni. (Mondjuk, én így sem értem:)

A mai (2025. szeptember) állapot szerint a Photoshop-ban ezek az AI eszközök találhatóak: Generative Fill tárgyak hozzáadására vagy eltüntetésére, Generative Expand képarány-nyitáshoz, Generate background (Háttér generálása) automatikus háttércseréhez, a Remove Tool vezetékek, kábelek és háttérben lévő emberek eltüntetéséhez, valamint a Generate Image (Kép generálása), amivel közvetlenül, szöveges promptból indíthatsz képet. AI-alapú kijelölők, mint a Select Subject és az Object Selection ; továbbá a Neural Filters családja, mint a Colorize, Skin Smoothing, Depth Blur, Super Zoom, JPEG Artifacts Removal, Harmonization, Landscape Mixer. Hú, és lehet, hogy ezt-azt kihagytam, de azért ebből is látszik az irány, egyre több feladatot végez el helyettünk a mesterséges intelligencia.
És akkor vannak a képgeneráló, javító applikációk. Például a MidJourney, amiről már több cikk is volt. Az utolsó lassan egy éve, és persze ez idő alatt is sokat fejlődött. És akkor ott van a DALL-E, az OpenAI képgeneráló modellje, ami 2023 őszétől beépült a ChatGPT-be. Míg a MidJourney jobb képeket generál, de borzalmasan rossz szövegértésben, a DALL-E mindent ért (persze magyarul is), viszont nem annyira jókat generál.
Mostanában nekem a Nano Banana a legizgalmasabb, ez a a Google DeepMind Gemini 2.5 Flash Image modellje. Ha minden igaz, hamarosan hivatalosan is bekerül a Photoshop-ba! Ez zseniális. Míg a MidJourney-nak hiába mutatsz egy képet, még véletlen sem azt használja fel, a Nano Banana-nak ez sikerült. Egy 10 évvel ezelőtti cikkben fotók retusálásáról írtam. Ez a nagymamám, és a készülő családfás fotókönyvbe ki kellett retusálni. A cellux-szal ragasztott rész különösen nagy kihívás volt, a fotópapír rasztermintázatáról nem is beszélve. Órákat szórakoztam vele, és közel sem lett tökéletes.

Most csak beraktam a Nano Banana-ba, és megadtam az instrukciókat. Pár másodperc alatt lett ez. De kérhettem volna sötétebbet, kontrasztosabbat vagy akár színeset is.

Természetesen írok róla majd részletes cikket.:)
Tehát meddig oké, és hol a határ? Attól függ mi a cél, kinek szánod, hol jelenik meg. Ez eldönt mindent. Nyilván lehet vele megtéveszteni, szándékosan átverni embereket, de nézzük a jó oldalát, hatalmas segítség a képszerkesztésben.
0 hozzászólás