Jaroslaw Marciuk

przez Think MICE

Przyszedł czas na AI Music

W poprzednich artykułach omawiałem kluczowe informacje na temat tego, w jaki sposób sztuczna inteligencja zmienia nasze życie zawodowe. Dzieliłem się nowościami o LLM (Large Language Models), takimi jak ChatGPT, mówiłem o tworzeniu zdjęć przy użyciu wprowadzanych do MidJourney czy DALL-E promptów oraz o generowaniu wideo z tekstu przy pomocy Sora AI. Teraz nadszedł czas na… muzykę!

W kwietniu internet huczał o nowych narzędziach do tworzenia muzyki, takich jak Suno AI (suno.com) czy Udio (udio.com). Suno działa oficjalnie w Cambridge (USA), a 21 marca firma udostępniła publicznie trzecią wersję swego narzędzia AI. Udio jest trochę bardziej zagadkowe, a jego wersja beta została upubliczniona 10 kwietnia. Na obu stronach można jednak już posłuchać piosenek wygenerowanych przy użyciu sztucznej inteligencji, z serwisów można też korzystać w bezpłatnych wersjach.

Jak działa Udio? Po prostu należy wpisać jaką piosenkę lub muzykę chce się stworzyć. Okienko na stronie podpowiada: „A song about…” zachęcając do kreacji. Następnie można określić rodzaj muzyki (np. rock, folk, pop), dodać instrumenty, wreszcie poprosić o stworzenie tekstu lub dodać własny (dla lepszych efektów Uido sugeruje podanie własnego tekstu, póki co nie dłuższego niż 250 – 300 znaków). W darmowej wersji można wygenerować 30 sekund muzyki. Po minucie, dwa pliki są gotowe do odsłuchania. Następnie, używając polecenia Extend, da się rozbudować piosenkę o kolejne 30 sekund, a w końcu wygenerować utwór trwający kilka minut.

Podobnie jest w Suno AI. Kluczową cechą jest możliwość generowania muzyki na podstawie promptu tekstowego, prostego lub bardziej rozbudowanego. Poprzez podanie opisu pożądanego gatunku lub tematu, zaawansowane algorytmy szybko wyprodukują kompletną kompozycję. W obydwu przypadkach nie można podać konkretnego artysty jako referencji do tworzonej muzyki.
Testowałem generowanie muzyki przez AI i muszę przyznać, że efekty są zaskakująco dobre. Suno wydaje się być łatwiejszy w użyciu do tworzenia dłuższych utworów, jest też lepszy pod względem kompozycji muzycznej i wokalnej oraz zachowania ciągłości w każdym utworze. Natomiast zdecydowanie słychać, że ogólna jakość dźwięku Udio jest atrakcyjniejsza i mniej zniekształcona (szczególnie w muzyce klasycznej). Na Spotify już teraz trudno byłoby rozpoznać, która piosenka została stworzona przez artystę, a która przez serwisy wykorzystujące AI.

Jakiego narzędzia można jeszcze użyć w tej zabawie z muzyką? Chociażby Noisee tworzącego animacje do wideo klipu. Firma stojąca za tym produktem reklamuje się sloganem „Seeing the unseen” i faktycznie w prostych krokach, po kliknięciu „Imagine” i podaniu kilku promptów sprawnie da się wygenerować klip do podanej muzyki (link do pliku Suno lub wgrany plik z muzyką). Cały proces trwa mniej niż 10 minut. Nie jest to co prawda poziom Sora AI, ale wygląda dobrze.

To fascynujące i przerażające zarazem. Rozumiem niepokój artystów i muzyków tworzących utwory na potrzeby komercyjne, do banków zasobów muzycznych, stocków utworów, a nawet twórców muzyki filmowej czy muzyki do gier. A to dopiero początek rewolucji. Według niektórych opinii, narzędzia takie jak Udio czy Suno AI mogą totalnie zmienić rynek muzyki stockowej w 1-2 lata, eliminując osoby zajmujące się tą profesją.

Ci, którzy mnie znają, wiedzą, że jestem entuzjastą nowych technologii, ale pozostaję również realistą i zastanawiam się nad negatywnymi aspektami takich rozwiązań. Celowo nie używam słowa „stworzony” a „wygenerowany”, bo tak jak w przypadku obrazów i wideo, Suno i Udio musiały nauczyć się działania na podstawie utworów stworzonych przez ludzi i pobranych do systemu przez założycieli tych przedsięwzięć. Ponownie zachodzi więc pytanie o prawa autorskie twórców muzyki, czy aby nie zostały one naruszone. Z pewnością te kwestie będą musiały zostać jak najszybciej doprecyzowane, gdyż obecnie nie są jasne i nie chronią twórców i ich utworów.
Pozostawiam Was z tą nowinką ze świata AI i stawiam otwarte pytania – jak można z niej korzystać w naszej branży oraz jak zmieni to nasz świat eventów...


Jaroslaw Marciuk. Jaroslaw Marciuk. Gdańszczanin, entuzjasta social mediów dostrzegający ich zalety i wady. Specjalizuje się w zagadnieniach związanych z marketingiem destynacji, social mediami oraz B2B influencer marketingiem. Główny specjalista Biura Spotkań i Wydarzeń – Poland Convention Bureau w Polskiej Organizacji Turystycznej. Pasjonat fotografii mobilnej, prowadzi społeczność Igers Poland. Po pięciu latach emigracji w Wielkiej Brytanii wrócił do Polski. Mieszka w Warszawie z żoną Alicją. Kontakt: jaroslaw@duolook.pl

CZYTAJ WIĘCEJ