Jaroslaw Marciuk

przez Think MICE

Inteligentne obrazy

Po raz pierwszy czytelnicy THINK MICE poznali ChatGPT i OpenAI w artykule ze stycznia br. („Czy warto zainteresować się ChatGPT?”). Od tego czasu wiele się wydarzyło. ChatGPT został m.in. zintegrowany z przeglądarką Microsoft Bing, zapowiedziano też, że będzie korzystał z treści powstałych po 21 września 2021 roku, bez potrzeby używania specjalnych wtyczek. Obecnie bezpłatnie można używać wersji 3.5, najnowsza 4.0 jest płatna. To jednak nie koniec nowości ze świata AI.

Tym razem chciałbym podzielić się kilkoma spostrzeżeniami na temat generowania obrazów z zastosowaniem sztucznej inteligencji. Z początkiem października br. OpenAI uruchomiło DALL·E 3 – kolejną wersję generatora obrazów z tekstu, którą można za darmo wypróbować na stronie http://bing.com/create. Po pierwszych testach i uzyskiwanych efektach wizualnych można powiedzieć, że trzecia generacja DALL·E 3 ma szansę stać się głównym konkurentem MidJourney.

Od sierpnia 2022 roku platforma MidJourney utrzymuje pozycję lidera i jest synonimem terminu „text to image” – czyli generowania obrazów na podstawie tekstu przy wykorzystaniu sztucznej inteligencji. Model MidJourney V5, który wszedł na rynek 15 marca br., zaprezentował niesamowity postęp w tworzeniu dokładniejszych i bardziej realistycznych obrazów. Ostatnia wersja 5.2, została opublikowana w czerwcu.

Jak to działa? Na podstawie tekstu wprowadzanego przez użytkownika (tzw. „promptu”) w języku angielskim, system tworzy obrazy. Zrozumienie sposobu komunikacji z AI jest kluczowe dla osiągnięcia zadowalających efektów. Na początek wystarczy rozpocząć od poleceń takich jak „/imagine” lub „/blend” i w miarę precyzyjnie opisać swoje oczekiwania. Metodą prób i błędów można nauczyć się uzyskiwać ciekawe efekty, ale warto znać kilka zasad. Należy również dodać kontekst, określić otoczenie, punkt widzenia, format, światło lub nawet poprosić o odwzorowanie konkretnego aparatu fotograficznego czy obiektywu.

Pewnym wyzwaniem dla początkujących użytkowników jest potrzeba posiadania konta na Discord. Korzystanie z MidJourney wiąże się z koniecznością posiadania profilu na tej  platformie (nie istnieje oddzielna strona internetowa ani aplikacja). Pod tym względem narzędzie DALL·E 3 może być bardziej przyjazne dla początkujących i bardziej intuicyjne w obsłudze. Gdy Midjourney został uruchomiony po raz pierwszy, każdy mógł stworzyć 25 obrazów za darmo. Teraz jest płatny (min. 10 dolarów miesięcznie).

Również inne firmy rozwijają narzędzia do generowania obrazów. Firefly, model sztucznej inteligencji Adobe, wprowadzono do popularnych aplikacji i programów graficznych, takich jak Adobe Illustrator i Adobe Photoshop. Graficy mogą korzystać z takich funkcji jak „Text to image”, „Text to pattern”, „Sketch to image”, „Extend image”, „Generative Fill” i „Generative Recolor”. Z tyłu nie pozostają Stable Diffusion, Canva, nawet Paint ma się doczekać funkcjonalności AI.

Ciekawą aplikacją, którą warto wypróbować jest Retrato. Pozwala ona na generowanie profesjonalnych portretów na podstawie 20-30 selfie. W tworzeniu zdjęć produktów przydatne są jeszcze Pebblely.com, Flair.ai i Booth.ai.

Pierwsze kampanie marketingowe wykorzystujące obrazy generowane przez sztuczną inteligencję pojawiły się już w Polsce (wśród nich Storytel, HalfPrice oraz „Ja w przyszłości. Powered by AI & ING”). Również w branży turystycznej można zauważyć próby wykorzystania sztucznej inteligencji m.in. w kampaniach promujących destynacje. Przykładem mogą być Jordan Tourism Board (kampania #ExperienceJordAIn), Visit Denmark (gdzie Chat GPT stworzył teksty postaciom takim jak Mona Lisa, Van Gogh czy Statua Wolności, zachęcające do odwiedzenia Danii), Vienna Tourist Board (kampania UnArtificial Art, promująca ponad 100 muzeów) czy włoska kampania Open to Wonder, w ramach której stworzono wirtualną influencerkę – współczesną wersję Venus z obrazu Sandro Botticellego (@venereitalia23). Z kolei w kampanii „Lithuania – an experience to share” wykorzystano obrazy generowane przez MidJourney.

Możliwość tworzenia obrazów z tekstu otwiera nowe perspektywy w tworzeniu kampanii reklamowych i kreowaniu treści wizualnych. Przykłady z Polski i ze świata dowodzą, że AI może odgrywać kluczową rolę w takich strategiach.

Jaroslaw Marciuk. Jaroslaw Marciuk. Gdańszczanin, entuzjasta social mediów dostrzegający ich zalety i wady. Specjalizuje się w zagadnieniach związanych z marketingiem destynacji, social mediami oraz B2B influencer marketingiem. Główny specjalista Biura Spotkań i Wydarzeń – Poland Convention Bureau w Polskiej Organizacji Turystycznej. Pasjonat fotografii mobilnej, prowadzi społeczność Igers Poland. Po pięciu latach emigracji w Wielkiej Brytanii wrócił do Polski. Mieszka w Warszawie z żoną Alicją. Kontakt: jaroslaw@duolook.pl

CZYTAJ WIĘCEJ