Mostanában a csapból is a mesterséges intelligencia téma folyik. Ezúttal csak egy egyszerű gyakorlati példát hoztam a filozofálás helyett, hogyan használtam az AI-t a munkámhoz.
A mesterséges intelligencia és logótervezés viszonyát előző cikkben taglaltam abból az aspektusból, hogy milyen minőségű logót készít a gép és el fogja-e venni a logótervező grafikusok munkáját az AI. (Spoiler: nem fogja). Viszont az AI-t is megkérdeztem erről, hogy mit gondol. Ezt már nem spoilerezem, hátha így elolvasod azt a cikket is, fentebb linkeltem!
Kép kiegészítése mesterséges intelligenciával
A feladat az alábbi volt:
Napi szinten készítünk bannereket közösségi média posztokhoz. Ezek általában szolgáltatások és termékek népszerűsítésére, brand ismertség növelésére készülnek. A termékekről készült fotókat sokszor csak önmagukban packshotként kapjuk meg. Ezért képszerkesztéssel látványos/hangulatos környezetbe tesszük, vagy használat közben szemléltetve mutatjuk meg, mert így sokkal szebb és érdekesebb, mintha csak a termékfotó jelenne meg. Az ilyen látványtervek kerülnek a posztba.
A probléma:
Van előfizetésünk stock fotó oldalhoz (ingyenes stock fotó oldalakat itt ajánlottunk), de a kedvenc képek nagy részét már sokszor használtuk az évek során. Ezért egyre nagyobb kihívást jelent újabb, termékfotóhoz passzoló képeket találnunk.
A megoldás:
A DALL-E 2 használatával egyszerűen csak feltöltöttem a termékképet háttér nélküli PNG formátumban. Feltöltés előtt bepozicionáltam úgy, hogy ne a teljes vásznat töltse ki a kép, hanem csak egy részén legyen.
Aztán beírtam azt is, hogy mi látható az általam feltöltött képen, valamint milyen hátteret szeretnék generálni.
Az eredmény egyszerre elképesztő és szórakoztató is. (Vagy csak én vagyok boomer, és egy fiatalabb generáció már nem dobja el ettől az agyát).
Több eredményt is generál, választhatunk, hogy melyik tetszik a legjobban. Vicces, hogy némely változatoknál kiegészítette a terméket, azaz a gépet egy nagyobb géppé.
Elképzelhető, hogy ha jobb szöveges instrukciót adok neki, akkor jobb eredményt produkálna. Ilyen irányba nem terjedt a kísérletem.
Ha eltekintünk a kisebb képi hibáktól, akkor kiválasztva a legjobban tetszőt, egy nagyon jó, élethű fotót kaptunk eredményül, amit letölthetünk teljesen ingyen. Többször is elvégeztem ugyanezzel a terméképpel a kísérletet, mindig más-más eredményeket kaptam, tehát nem kell beérnünk ezzel a 4 változattal, ha még próbálkoznánk.
Ha figyelembe vesszük azt is, hogy a DALL-E jelenleg 1 éve van jelen, igencsak figyelemre méltó, egészen biztosan óriásit fog még fejlődni. Talán 1-2 év múlva frissítenem kell ezt az írást, mert annyival fejlettebben fog működni, hogy amitől most leesett az állam, azt akkor már sokszorosan felül fogja múlni.
Egyéb felhasználás
El tudok képzelni más alkalmazási módokat is. Kipróbáltam azt, hogy feltöltés után kitörlöm a fotó egy kis részletét és beírom szavakkal, hogy mi kerüljön oda.
Az alábbi példában a fotón látható köveket kitöröltem a képből és beírtam, hogy kerüljön oda egy kerti törpe:
Hallomásból tudok olyan grafikusról, aki azzal spórol időt, hogy több stílusú képeket (például logó terveket) generál AI-val. Ezeket átküldi a megrendelőnek, hogy válasszon, melyik tetszik neki a legjobban. Ezt az infót alapul véve a grafikus elkészíti saját kezűleg az egyedi logót.