Czy muzycy są jeszcze potrzebni? Czyli o wykorzystywaniu sztucznej inteligencji do tworzenia muzyki

Rafał Samborski

Rozwój generatywnej sztucznej inteligencji dotknął w zasadzie każdego aspektu życia w internecie. Każdego dnia w serwisach społecznościowych stykamy się z setkami treści, zdjęć i filmów wygenerowanych za pomocą ChataGPT, Groka czy Sorę AI. Nie inaczej jest z muzyką - utwory tworzone za pomocą SUNO AI stają się viralami na TikToku i rozgościły się na stałe w topowych playlistach na serwisach streamingowych. Ale o co w tym wszystkim chodzi i dokąd to zmierza?

O użyciu sztucznej inteligencji w muzyce opowiedział m.in. Patrick The Panalex kuhnAgencja FORUM

Przyznaję, że inspiracja do powstania tego tekstu stała się dość jasna. W styczniu 2025 roku Mikey Shulman - CEO SUNO AI - udzielił wywiadu Harry'emu Stebbingsowi w ramach serii 20VC. To podcast skupiony przede wszystkim na sprawach biznesowych. Dopiero rok później fragment z tej rozmowy rozpowszechnił się szeroko w internecie.

Shulman w wywiadzie tym powiedział rzecz, która zmroziła umysły wielu artystów. "Proces tworzenia muzyki nie sprawia ludziom radości. To zabiera dużo czasu, wymaga praktyki. Musisz nauczyć się dobrze grać na instrumencie albo dobrze korzystać z programów do produkcji. Myślę, że większość ludzi, którzy tworzą muzykę, nie czerpie radości z czasu, który spędzają, tworząc ją".

Przypominam, że SUNO to firma odpowiedzialna za aplikację służącą generowaniu muzyki za pomocą algorytmów sztucznej inteligencji. I nie widzę w tym przypadku, że musiał minąć aż rok, nim słowa Shulmana dotarły do twórców i muzyków. W końcu jeszcze rok temu wypełnianie playlist na serwisach streamingowych muzyką tworzoną przez generatywną sztuczną inteligencję stanowiło raczej tajemnicę poliszynela, do której wielu gigantów w żaden sposób się nie przyznawało. Dziś te same firmy oficjalnie zawierają umowy z dostarczycielami utworów generowanych przez algorytmy generatywnej sztucznej inteligencji.

Ale o co chodzi w ogóle z tym AI w muzyce?

Sprawa na papierze jest dość prosta: narzędzia do generowania muzyki za pomocą sztucznej inteligencji pozwalają w szybki sposób uzyskać określony utwór po wpisaniu odpowiedniej instrukcji. Wystarczy szybki prompt w stylu np. "rap w stylu wczesnych lat dwutysięcznych o trudnym życiu na ulicach Warszawy" i aplikacja chwilę później generuje utwór, który brzmi niczym pierwsze nagrania zespołów pokroju Molesta czy Hemp Gru. I to zarówno na poziomie muzyki, jak i tekstu. Do efektu oczywiście można wprowadzać określone poprawki, można również zapewnić całości autorską warstwę liryczną. Jednakże skąd aplikacja wie, że ma brzmieć w określony sposób?

Teoretycznie twórcy aplikacji opartych na uczeniu maszynowym - bo tak też nazywa się ten proces - powinni pozyskiwać pozwolenie na korzystanie z dzieł znajdujących się w ich bazach danych. Czy tak jest w rzeczywistości? Cóż, jakiś czas temu głośno było o eksperymencie, w którym badacze z Uniwersytetu Yale i Uniwersytetu Standforda postanowili przetestować najpopularniejsze wielkie modele językowe i nakazać im napisanie "Harry'ego Pottera i Kamienia Filozoficznego" J.K. Rowling oraz "Roku 1984" George'a Orwella. Niektóre, owszem, odmówiły współpracy, jednak były przypadki, gdy badaczom udało się odwzorować słowo w słowo niemal 96% materiału źródłowego. Nieźle, jak na dzieła chronione prawem autorskim, prawda?

Z bazami danych do tworzenia muzyki za pomocą sztucznej inteligencji nie jest inaczej. Niewiele wiadomo na temat tego, w jaki sposób twórcy modeli AI pozyskują utwory, które następnie są wykorzystywane do nauki. Niewątpliwe jest natomiast to, że niezbyt przejmują się prawami autorskimi, co doskonale słyszymy w efektach, w których niejednokrotnie da się dostrzec mocne inspiracje oryginałami.

Piotr Madej, muzyk i producent znany szerzej jako Patrick The Pan - twórca albumów takich jak "Miło wszystko" czy "To nie najlepszy czas dla wrażliwych ludzi" - widzi sprawę dość jasno: "To kradzież i uważam, że powinno być to w jakiś sposób rozliczone. Oczywiście myślę, że jest już na to za późno i sprawy ciągnęłyby się pewnie dekadami, ale taka masowa kradzież dóbr intelektualnych to zagranie poniżej pasa".

Wtóruje mu Maciej Karbowski - związany z zespołem Tides of Nebula, muzyk, producent, realizator oraz inżynier dźwięku, a także współwłaściciel Nebula Studio: "Dobrze by było, jakby prawo nadążało za tą kwestią, ale to rozwija się zbyt dynamicznie, więc nie mam złudnych nadziei. Patrząc na to, jakie pieniądze leżą w tej technologii, nie mam nawet nadziei, że interesy artystów będą chronione."

"Tak jak nie mogę wziąć połowy czyjegoś utworu i bez konsekwencji dopisać do niego własnego wersu, tak samo wykorzystywanie cudzej twórczości, nawet jeśli staje się ona ostatecznie tylko częścią wielkiego zlepku milionów nagrań, nie powinno mieć miejsca bez wiedzy i wyraźnej zgody artystów" - mówi nam z kolei Mateusz Jarząbek znany pod pseudonimem Bulsjarz - połowa duetu rockowego The Bullseyes.

AI Slop opanowuje playlisty

Momentem, w którym skala problemu zaczęła być znana nie tylko wąskiemu gronu osób zaangażowanych w muzyczny świat, ale dotarła również do masowego odbiorcy w Polsce, była viralowa popularność nagrań wypuszczanych pod mianem Ku.as Records.

AI Slop to sformułowanie odmieniane w ostatnich miesiącach przez wszystkie przypadki. Jednak z dziennikarskiego obowiązku wyjaśnię tylko, że takim mianem określa się treści generowane za pomocą sztucznej inteligencji, charakteryzujących się niską jakością wykonania, bądź ich masowością i chęcią wywoływania w odbiorcach określonych reakcji.

Doskonały przykład AI Slopu stanowią filmiki przedstawiające zwierzęta wykonujące zachowania charakterystyczne dla ludzi, np. śpiew lub taniec, rozprzestrzeniające się viralowo motywacyjne przemowy Bruce'a Lee, które nigdy nie miały miejsca oraz - z ostatnich przypadków - zdjęcia z rzekomego ślubu Toma Hollanda i Zendayi. Właśnie takim ekwiwalentem AI Slopu w świecie muzycznym są nagrania Ku.as Records.

Choć twórcy Ku.as Records deklarują, że "to projekt muzyczny AI o tematyce LGBT", w rzeczywistości mamy do czynienia z generowanymi za pomocą sztucznej inteligencji utworami charakteryzujące się prostackim humorem oscylującym głównie wokół hiperseksualności, ejakulacji na wszystko, co możliwe, i stereotypów krążących wokół społeczności nieheteronormatywnej. Efekt? Tysiące treści z tymi utworami rozpowszechnianymi na TikToku oraz Instagramie i absolutna dominacja na playlistach serwisów streamingowych pod koniec 2025 roku.

W ślad za tym trendem pojawili się naśladowcy - a być może nawet ci sami twórcy, ale pod innymi aliasami. Ba, w chwili, gdy piszę ten tekst, na pierwszym miejscu playlisty "Viral Top 50" na Spotify znajduje się utwór "Gejowski nurek" podpisany przez GAY RECORDS. Nawet mało wnikliwe spojrzenie powala dostrzec, że to niejedyny AI Slop na tej liście.

"Teraz to zjawisko bawi odbiorców, ale podobnie jak wizualny AI slop spotyka się z coraz większym potępieniem, tak samo ostatecznie stanie się z taką muzyką. Na pewnym etapie dla słuchacza i tak najbardziej interesujące pozostaną rzeczy o prawdziwej wartości emocjonalnej" - przewiduje Bulsjarz.

Czy nieświadomie słuchamy muzyki generowanej przez sztuczną inteligencję?

Przyznaję - przypadek Ku.as Records może wydawać się skrajny, ale obcowanie z muzyką generowaną przez AI to rzecz, która może dotknąć każdego z nas.

Zobacz również:

Pop

Urszula: Siła miłości. Historia sukcesu płyty "Biała droga"

Michał Boroń

Popularne playlisty zawierające muzykę mającą pomagać w skupieniu czy nauce - tagowane zazwyczaj jako "lo-fi hip-hop beats" albo "ambient to focus" - to w dużej mierze właśnie wytwory sztucznej inteligencji. Chwila researchu pozwala odkryć, że za setkami tysięcy odtworzeń i okładkami zawierającymi zazwyczaj ładne widoki, kryją się pseudonimy, które zupełnie nie istnieją poza serwisami streamingowymi, na których zostały umieszczone. Oczywiście, w żaden sposób nie są oznaczone jako dzieła AI.

"Muzyka generowana sztucznie nie powinna być stawiana obok utworów, które człowiek stworzył i nagrał samemu. Nie powinno dochodzić do sytuacji, w których muzyka tworzona za pomocą promptu wypiera to, co zostało nagrane przez człowieka - to jest po prostu nie fair. W idealnym świecie powstałaby osobna platforma streamingowa dla muzyki generowanej przez AI, ale to bardzo utopijna wizja" - dodaje Patrick The Pan.

Ruch serwisu streamingowego Bandcamp z początku stycznia 2026, kiedy to jego twórcy ogłosili, że utwory tworzone ze znacznym udziałem AI nie będą akceptowane na ich platformie, to oczywiście promyk optymizmu. Ale za mały, aby móc nim zarażać.

Czy muzycy zostaną zastąpieni przez AI?

Nie można tu nie wspomnieć o sytuacji zespołu King Gizzard & The Lizard Wizard - prawdopodobnie jednego z najbardziej płodnych i docenianych zespołów rockowych ostatnich lat. Australijska grupa w połowie zeszłego roku była jednym z wielu bandów - tuż obok Xiu Xiu, Deerhoof czy Hotline TNT - które postanowiły usunąć wszystkie swoje utwory z platformy Spotify. Powód? Inwestycje CEO szwedzkiej spółki, Daniela Eka, w technologie militarne oparte na sztucznej inteligencji.

Niedługo po zniknięciu grupy z serwisu streamingowego, na Spotify pojawił się profil zespołu King Lizard Wizard, grającego muzykę identyczną z tym, co reprezentują Australijczycy. Podobieństwo nie obejmowało wyłącznie stylistyki na poziomie muzycznym, ale również innych aspektów ich dzieł: nazw płyt, utworów, okładek - wszystko było zbliżone do tego, z czym kojarzyć można było zespół. Oczywiście wszystko zostało wygenerowane za pomocą sztucznej inteligencji. Podróbka została szybko zdjęta ze Spotify, choć niesmak pozostał. Czy w takim razie muzycy obawiają się, że zostaną zastąpieni przez AI? Co ciekawe - niekoniecznie.

"Wszyscy artyści zarobkowi zaczną mieć problem, ponieważ sztuczna inteligencja będzie robić ich robotę lepiej od nich. To zmusi ich w końcu do podniesienia poprzeczki albo będą musieli odpaść z tego poziomu szczytu, na którym znajdują się w tej chwili. A to może zrobić miejsce artystom, którzy naprawdę są artystami" - mówi w rozmowie z nami Kopruch, raper i producent, żyjący w masowej świadomości jako autor utworu "Nie musisz (Po prostu bądź)", oraz założyciel i właściciel studia produkcji filmowej Przedmarańcza, autor wielu spotów reklamowych oraz teledysków, między innymi nagradzanego wielokrotnie klipu do "404" Pokahontaz i Kalibra 44.

Wydawało się, że wypowiedź Koprucha jest dość przekorna, ale Patrick The Pan ma podobne spojrzenie: "Myślę, że AI zagraża przede wszystkim wielkim popowym producentom albo muzykom tworzącym muzykę do windy, bo to będzie łatwe do wyplucia. Ale każdy artysta, który ma w sobie wrażliwość, głębię i skazę, którą nakazuje mu przemawiać przez sztukę, nie będzie zastępowalny. Sztuczna inteligencja nie ma emocji, nie wie, czym jest ból, trauma, złamane serce." - dodaje mój rozmówca.

Generatywne AI w muzyce - czego tak naprawdę należy się obawiać?

Choć obawy dotyczące wykorzystywania AI do generowania utworów się przewijają, to nie oscylują wokół straty przestrzeni do działania przez muzyków, a tym bardziej nie działają na nich demotywująco. "Pewnie dojdzie do sytuacji, w których ludzie chcący zostać producentami będą próbowali się na tym opierać i podpisywać to własnym nazwiskiem. A to w zasadzie jest scam" - komentuje sprawę Maciej Karbowski.

Kopruch odpowiada w sposób bardziej filozoficzny: "Poczucie, że ludzkie ręce są zdolne do tworzenia, jest ważne i zaczyna nam znikać, kiedy zastępujemy się sztuczną inteligencją. A dalsze zastępowanie sztucznej inteligencji może doprowadzić do tego, że przestaniemy przeżywać te rzeczy, które sami tworzymy. Kiedy fragment tego mistycznego przeżycia zniknie, stracimy jako ludzkość z pewnością rzecz absolutnie unikalną. Jeżeli istniałby wielki czerwony przycisk, który umożliwiłby zatrzymanie tego, to byłbym pierwszą osobą, która pobiegnie go nacisnąć".

Co jest sensem twórczości w erze sztucznej inteligencji?

Kopruch w swojej działalności filmowej prowadzi kursy z postprodukcji video z wykorzystaniem AI. Przyznaję, że wybrałem go jako jeden z głosów w tym tekście, bo spodziewałem się spojrzenia nieco innego niż od moich pozostałych rozmówców. Artysta podchodzi do sprawy jednak bardzo pragmatycznie: "Filmy to mój zawód. Pozwalam sztucznej inteligencji pracować w miejscach, które są absolutnie budżetowo nieosiągalne dla mnie, ponieważ ich zrobienie kosztowałoby miliony dolarów. Część efektów to sprawy, które jeszcze dwa lata temu trzeba by było zlecić Industrial Light & Magic. A w reklamie i teledyskach w Polsce tych milionów zwyczajnie nie ma. Muzyką natomiast mogę się bawić, bo nie jest moim zawodem. Muzyka dla dzieci, którą teraz tworzę jako Małe Cienie, tym bardziej powinna być czysta i wolna od tego, ponieważ chodzi o zabawę i radość tworzenia, przekazywanie tego. Zastępowanie się robotem w tych funkcjach nie ma sensu. A jak na czymś nie umiem grać, chciałbym porozmawiać z kimś, kto to potrafi zrobić. Porozmawiać o tej muzyce, przeżyć wspólną muzyką przygodę".

Faktycznie aspekt społeczny to coś, co również przewija się regularnie w wypowiedziach moich rozmówców. Patrick The Pan zahacza o ten sam temat, komentując wypowiedź Mikeya Shulmana, o której wspomniałem na początku tekstu: "Według mnie właśnie o całą tę radość tworzenia muzyki chodzi. Tworzenie, czasami siedzenie nad rozwiązaniami tygodniami i szukanie go, to sens tego wszystkiego. Ta satysfakcja, kiedy napiszę piosenkę, jest niezastępowalna - zastąpienie tego całego procesu, który często jest trudny, promptem, który po kilkunastu sekundach wypluje wynik, jest wręcz okrutne. Myślę zresztą, że człowieka zawsze będzie ciągnąć do człowieka. Szczególnie że o to chodzi w sztuce, by łączyła ona ludzi".

Czy da się korzystać ze sztucznej inteligencji w muzyce w sposób etyczny?

Postanowiłem spytać moich rozmówców, czy widzą szansę na to, aby dało się wykorzystywać sztuczną inteligencję w muzyce w sposób etyczny i niepozostawiający najmniejszych wątpliwości w kwestiach uczciwości wobec słuchaczy. Tutaj artyści, z którymi rozmawiałem, są raczej zgodni: tak, ale odpowiedź tę należy oznaczyć gwiazdą i ubogacić komentarzem.

"Wydaje mi się, że sztuczna inteligencja może się sprawdzić na etapie pisania demówek - na przykład jeżeli ktoś chce dopisać sobie partię bębnów albo ma napisany numer i potrzebuje prostej partii basu, by wypróbować pomysł. Ale, prawdę mówiąc, zastępowanie artysty to sr...e sobie do gniazda". - mówi nam Maciej Karbowski z Tides From Nebula.

Wątek ten kontynuuje Patrick The Pan. "Temat jest dla mnie jeszcze bardzo świeży (…). Tworzę demówkę dla pewnego projektu - póki co zdalnie, bez artystów. Wyobrażam sobie, że jakbym miał ich w studio, to mógłbym im powiedzieć, że mogą spróbować teraz zaśpiewać wspólnie chórek. Nie jestem w stanie tego zrobić, dopóki nie przyjadą do studia, jednak chcę im pokazać taki pomysł, więc poprosiłem sztuczną inteligencję o wygenerowanie mi chóru i byłem zadowolony z efektu. Jednak najpierw wyśpiewałem tę melodię, więc de facto AI dopełniło mój głos innymi głosami. Taki sposób korzystania z narzędzia akceptuję - gorzej, jeżeli ktoś pisze prompt, aby wypluć piosenkę w stylu Guns N' Roses z tekstem o złamanym sercu i po 30 sekundach otrzymuje efekt, który uznaje za finalny produkt".

Bulsjarz ma nieco bardziej liberalne spojrzenie na temat, ale nadal oscylujące wokół pełnej kontroli artysty nad końcowym efektem: "Wygenerowanie setki wariantów utworów tylko po to, by wyselekcjonować ten, który najbardziej nam odpowiada, to zdecydowanie za mało. Jeśli jednak twórczo wykorzystamy wygenerowane przez AI elementy jako składowe interesującej, spójnej całości, która doskonale oddaje autorską wizję i przeciera zupełnie nowe szlaki - dlaczego by nie spróbować?".

"Są rzeczy tak abstrakcyjne jak stuosobowy chór, na który mało którego artystę stać. Ale jeżeli są rzeczy, które moglibyśmy zlecić nawet znajomemu za niewielką kwotę - na przykład partię gitary elektrycznej - to nie jest dla mnie uzasadnione" - mówi za to Kopruch.

Po chwili dodaje jednak wypowiedź, która wydaje się idealnym zwieńczeniem tego tekstu: "Czysto przez przekorę i niechęć do zastępowania się w sztuce, wiem, że i tak nie użyję sztucznej inteligencji do wygenerowania stuosobowego chóru. Może moje życie tak się ułoży, że kiedyś będę mógł zarejestrować dziesięcioosobowy żywy chór - i prawdę mówiąc, to mi w pełni wystarczy".

Czadowa Mamuśka w „MBTM”. Sebastian Karpiel-Bułecka ruszył w pląsyPolsat Promocja