ChatGPT Images 2.0

ChatGPT Images 2.0

Ismét egy AI-eszköz, ami csodákra képes. A ChatGPT-t eddig is használtam, de a képgeneráláshoz egyáltalán nem, csak annyiban, hogy promptokat írattam vele. Képgenerálásra ott a Midjourney és a Nano Banana, utóbbi már a Photoshop-on belül is elérhető.

A MidJourney gyors (ha arra állítod), három variációt készít egyszerre, viszont a szövegekhez nagyon nem ért. Még az angolhoz sem, a magyar végképp nem megy szegénynek. A Nano Banana szuper, több cikk is van róla a blogon, érdemes megnézni.

Most viszont megjelent a ChatGPT Images 2.0, és az első próbák alapján nagyon úgy tűnik, hogy komoly kihívó érkezett. Jobb szövegkezelés, pontosabb utasításkövetés, erősebb szerkesztési lehetőségek.

Az első próbához egy szinte reménytelenül életlen fotót választottam. Nem kicsit bemozdult, nem csak finoman homályos, hanem olyan kép, amit eddig semmilyen más eszközzel nem sikerült igazán használhatóvá tenni. Lehetett rajta élesíteni, zajt csökkenteni, részleteket visszahozni próbálni, de csodát egyik módszer sem tett vele.

A ChatGPT Images 2.0 viszont egészen másképp nyúlt hozzá. Fontos tudni, hogy ilyenkor nem egyszerűen „feljavítja” az eredeti képet, hanem újragenerálja azt a látott információk alapján. Vagyis nem arról van szó, hogy a régi pixelekből varázsol elő rejtett részleteket, hanem megpróbálja értelmezni, mi van a képen, és abból készít egy éles, hihető változatot.

Ez persze rögtön felveti a legfontosabb kérdést: vajon mennyire stimmel az eredmény? Nem, nem tökéletes. Mivel saját fotó, saját gyerek, látom. De alig van információ az életlen képből. A gyerek szeme a valóságban zöld, az új képen viszont inkább barnás lett. De mindenképp elképesztő az eredmény.

A kiindulási pont itt már jobb volt, így a végeredmény is szuper. Tökéletesen éles és színhelyes képet generált.

Elképesztő grafikákat is csinál, ha a képgenerálásra mész, van pár javaslata.

Csak rákattintottam az Illusztrált receptre, és ez lett belőle (megjelent egy prompt, de azon nem változtattam).

Lehet „kérni” újságot is, alapból ez a prompt van, amit most sem változtattam meg.

(tovább…)
NotebookLM

NotebookLM

Örömmel láttam, hogy a Nano Banana és a Google Earth házasítása ekkora sikert aratott! Úgy tűnik, nem csak én vagyok oda a technológia és a kreativitás találkozásáért. Ha az tetszett, akkor szerintem a NotebookLM-t is érdekesnek találjátok.

De mi is ez, és hogy tudjuk használni a fotókönyv szerkesztésénél?

A NotebookLM a Google mesterséges intelligenciával támogatott jegyzetelő- és kutatóalkalmazása. A lényege az úgynevezett forrásalapú AI. Míg a ChatGPT vagy más chatbotok a „nagyvilág” adataiból merítenek, a NotebookLM-nek te adod meg a forrásokat (legyen az egy PDF, web oldal, videó, saját jegyzet, stb), és ő kizárólag ezekből dolgozik.

Rengeteg mindenre lehet használni, de mivel mi fotókönyveket készítünk, két felhasználási módot nézünk meg. Szöveget ír nekünk pl. az utazás helyszínéről, és készít egy látványos grafikát, ami amellett, hogy informatív, még díszíti is az oldalt.

A jó hír, hogy bár léteznek fizetős csomagok a professzionális kutatók számára, nekünk a fotókönyv-szerkesztéshez bőven elég az ingyenes verzió. Az ingyenes csomagban is akár 100 különböző jegyzetfüzetet hozhatsz létre, és notebookonként 50 forrást adhatsz hozzá, ami több mint elég.

A kezdéshez látogass el a notebooklm.google oldalra. Miután beléptél a Google-fiókoddal (ez az egy kell hozzá), katt a NotebookLM kipróbálására.

Kattints az „Új létrehozása” gombra.

A felület három fő részre oszlik:

Jobb oldal – Studio: Itt találod, hogy mit is lehet generálni.

Bal oldal – Források: Ide töltheted fel azokat az anyagokat, amikből az AI dolgozni fog.

Középső rész – Csevegés: itt beszélgethetsz az AI-val.

(tovább…)
Nano Banana & Google Earth

Nano Banana & Google Earth

A Google Gemini AI Studio-ról már volt szó, most azt mutatom meg, hogy mire képes a Nano Banana Pro a Google Earth-szel karöltve. Emlékeztek erre a cikkre?

Annál a cikknél Google Maps-et használtuk. Most is lehet azt, de a Google Earth jobb választás, mert részletesebb műhold és légi felvételt ad. Az egér görgőjével lehet zoomolni, bal egérgombbal a térképet mozgatni. A nézet forgatásához és döntéséhez a Shift billentyűt lenyomva tartva kell az egeret mozgatni: így lehet az épületeket ferde, térbeli perspektívából megjeleníteni.

Készíts egy monitorfotót, és a Google AI Studioban válaszd a Nano Bana Pro-t. A Nano Banana Pro használata nem teljesen ingyenes: ha elfogy a Gemini AI Studio-ban elérhető ingyenes kereted, akkor fizetni kell a képgenerálásért. A Google Gemini API árazása alapján egy kép generálása kb. 0,039 USD, ami ma körülbelül 15–20 Ft körül van (a devizaárfolyamtól függően). Ha ezt a scrapbook készletek árához viszonyítjuk, igazán nem sok. 😀

Simán írhatsz promptot magyarul, megérti. Ez lett belőle. Azért ez nem néz ki rosszul egy fotókönyv oldalán:) Pláne, hogy így nem nagyon tudod lefényképezni.

De adhatsz bármilyen más utasítást is. Például ezt írtam:
Használd a feltöltött képet referenciaként egy magas minőségű 3D épületmodellhez. Az épület egy letisztult, körbevágott talajszigeten jelenjen meg, enyhén kiemelve a környezetéből. Őrizd meg az arányokat és a fő részleteket. Izometrikus nézet, fehér háttér, prezentációs stílus.

(tovább…)