Kai algoritmas pradeda dainuoti
Dar prieš kelerius metus mintis, kad dirbtinis intelektas galės sukurti pilnavertę dainą su vokalu, instrumentais ir netgi emociškai įtikinamais žodžiais, atrodė kaip mokslinė fantastika. Šiandien tai realybė, ir ne bet kokia – Suno bei Udio platformos generuoja muzikos kūrinius, kuriuos eilinis klausytojas dažnai neskiria nuo žmogaus sukurtų. Tai ne tik technologinis žingsnis į priekį – tai visiškas muzikos kūrybos paradigmos lūžis.
Šiame straipsnyje pažvelgsime į tai, kaip šios platformos veikia, kuo skiriasi, kaip jas naudoti efektyviai ir ką visa tai reiškia tiek kūrėjams, tiek paprastiems muzikos mėgėjams. Spoileris: situacija yra daug įdomesnė, nei atrodo iš pirmo žvilgsnio.
Kaip tai iš viso veikia – be beprasmiško techninio žargono
Tiek Suno, tiek Udio yra paremti dideliais generatyviniais modeliais, kurie buvo apmokyti ant milžiniškų muzikos duomenų rinkinių. Principas panašus į tai, kaip veikia tekstiniai DI modeliai – sistema „išmoksta” muzikos struktūrą, žanrų ypatybes, instrumentų skambesį, vokalo stilius ir netgi tai, kaip tam tikros emocijos perteikiamos muzikoje.
Techniškai kalbant, šie modeliai dirba su audio tokenais – muzika yra „suskaidoma” į mažus segmentus, kurie koduojami kaip matematiniai vektoriai. Modelis išmoksta, kokie tokenų deriniai sudaro harmoningą melodiją, kokie – ritminę struktūrą, o kokie – vokalo frazę. Generuojant naują kūrinį, sistema iš esmės „nuspėja” sekančius tokenus pagal pateiktą aprašymą (promptą).
Bet čia yra vienas niuansas, kurį dažnai praleidžia: šie modeliai ne tik kopijuoja – jie interpoliuoja. Tai reiškia, kad jie kuria naujus derinius iš to, ką „matė” mokymosi metu. Todėl galite gauti kažką, kas skamba kaip jazz-metal su lofi estetika ir lietuvišku folkloro elementu – ir tai nebus tiesiog koliažas iš esamų kūrinių.
Suno – kai paprastumas tampa stiprybe
Suno šiuo metu yra bene populiariausia DI muzikos generavimo platforma, ir tam yra labai konkrečios priežastys. Pirmiausia – naudojimo paprastumas. Jūs tiesiog įrašote, ko norite, ir sistema sukuria kūrinį. Nereikia žinoti muzikos teorijos, nereikia mokėti naudotis DAW programomis, nereikia net suprasti, kas yra BPM.
Suno v3 ir v4 versijos padarė milžinišką šuolį kokybės atžvilgiu. Vokalo generavimas tapo toks tikroviškas, kad kartais net sunku patikėti, jog tai ne žmogus dainuoja. Platforma palaiko:
- Pilnų dainų generavimą su įžanga, posmeliais, refrenu ir outro
- Instrumentinės muzikos kūrimą
- Kūrinių tęsimą – galite paimti esamą fragmentą ir „pratęsti” jį
- Stiliaus klonavimą pagal aprašymą (ne pagal konkretų kūrinį)
- Dainų tekstų integravimą – galite pateikti savo žodžius
Vienas iš praktinių patarimų dirbant su Suno: nebūkite per daug lakoniški su promptais. „Liūdna daina” duos vidutinišką rezultatą. Tačiau „melancholiška indie pop daina su akustine gitara, subtiliu fortepijonu fone, moterišku vokalu, apie prarastą vasarą ir jaunystę” – tai jau visai kitas lygis. Kuo daugiau konteksto, tuo labiau modelis gali „suprasti” jūsų viziją.
Dar vienas dalykas – Suno turi nemokamą planą, kuris leidžia generuoti ribotą kiekį kūrinių per dieną. Tai puiku eksperimentavimui, bet jei norite rimtai dirbti, Pro planas (apie 10 USD per mėnesį) yra visiškai pagrįstas. Jis suteikia ir komercinės naudos teisę, kas svarbu, jei planuojate naudoti sugeneruotą muziką savo projektuose.
Udio – kai svarbiau kokybė nei greitis
Udio pozicionuoja save šiek tiek kitaip. Jei Suno yra kaip greitas ir patikimas automobilis, tai Udio – labiau kaip sportinis modelis, kuriam reikia šiek tiek daugiau dėmesio, bet rezultatas gali būti įspūdingesnis. Platforma buvo sukurta buvusių Google DeepMind darbuotojų, ir tai jaučiasi – modelis yra labai stiprus tuo, ką galima pavadinti muzikine koherencija.
Udio generuoja trumpesnius segmentus (paprastai apie 30 sekundžių), bet juos galima jungti į ilgesnius kūrinius naudojant „extend” funkciją. Tai suteikia daugiau kontrolės – galite kurti kūrinį dalimis, kiekvieną kartą tikrinant ir koreguojant kryptį. Tai labiau primena tikrą kūrybinį procesą nei vienkartinį generavimą.
Udio pranašumai, kuriuos verta žinoti:
- Muzikos detalumas – instrumentų atskyrimas skamba natūraliau, mažiau „DI skonio”
- Žanrinis tikslumas – jei prašote specifinio žanro, sistema jį atpažįsta geriau
- Vokalo įvairovė – galima pasiekti įvairesnių vokalo stilių ir charakterių
- Promptų lankstumas – sistema gerai reaguoja į muzikinius terminus (chord progressions, time signatures ir pan.)
Praktinis patarimas dirbant su Udio: naudokite negatyvius promptus. Tai reiškia, kad galite nurodyti, ko nenorite – pavyzdžiui, „no distorted guitar, no heavy drums, no autotune”. Tai labai efektyvus būdas suformuoti tikslesnį rezultatą, ypač kai dirbate su specifiniais žanrais ar nuotaikomis.
Promptų menas – kaip kalbėti su muzikos DI
Čia yra ta vieta, kur dauguma žmonių padaro klaidų. Jie bando DI muzikos generavimą kaip Google paiešką – trumpas, faktinis tekstas. Bet šie modeliai veikia kitaip. Jie reaguoja į kontekstą, nuotaiką, tekstūrą ir asociacijas.
Keletas konkrečių promptų strategijų:
Žanrų derinimas: Vietoj „rock daina” rašykite „indie rock su shoegaze elementais, reverb-heavy gitaros, dreamy atmosfera”. Modeliai puikiai supranta žanrų hibridus ir dažnai tai duoda įdomiausius rezultatus.
Emociniai aprašymai: Žodžiai kaip „melancholiškas”, „euforiškas”, „neramus”, „nostalgiškas” labai stipriai veikia galutinį rezultatą. Tai ne tik apie instrumentus – tai apie tai, kaip muzika turėtų jaustis.
Referenciniai taškai: „Panašiai kaip Radiohead, bet su elektroniniais elementais” arba „kaip 80-ųjų synthwave, bet su šiuolaikine produkcija” – tokio tipo aprašymai padeda modeliui suprasti stilistinę kryptį. Svarbu: jūs ne kopijuojate artistus, o naudojate juos kaip stilistinį orientyrą.
Techniniai parametrai: Jei žinote muzikos teoriją, galite nurodyti tempą (BPM), tonaciją, netgi chord progression. Pavyzdžiui, „slow tempo around 70 BPM, minor key, jazz chord progressions with 7th chords”. Tai suteikia modeliui labai tikslias instrukcijas.
Scenos kūrimas: Vienas iš mano mėgstamiausių metodų – aprašyti sceną ar situaciją, o ne tik muzikos stilių. „Muzika tuščiam miesto gatvių vaizdui ankstų rytą, kai dar nėra žmonių, tik tolimas traukinio garsas” – toks aprašymas gali duoti neįtikėtinai atmosferiškų rezultatų.
Teisiniai ir etiniai klausimai – tai negalima ignoruoti
Čia prasideda sudėtingesnė dalis. DI muzikos generavimas šiuo metu yra teisinės pilkosios zonos centre, ir tai yra labai reali problema, kurią turite žinoti prieš naudodami šias platformas komerciniams tikslams.
Pagrindinė problema: šie modeliai buvo apmokyti ant muzikos, kurios autoriai nesuteikė leidimo. Keletas stambių rekordų kompanijų (Universal Music Group, Sony Music) jau yra padavę Suno ir Udio į teismą JAV, teigdami autorių teisių pažeidimą. Bylos dar nagrinėjamos, bet tai rodo, kad situacija nėra paprasta.
Ką tai reiškia praktiškai:
- Asmeniniam naudojimui ir eksperimentavimui – problemų paprastai nekyla
- Komerciniam naudojimui – būtinai patikrinkite platformos naudojimo sąlygas ir licencijos tipą
- Suno Pro ir Creator planai suteikia komercinės naudos teisę, bet tai nereiškia, kad visi teisiniai klausimai išspręsti
- Jei planuojate naudoti sugeneruotą muziką dideliam projektui ar reklamai – konsultuokitės su teisininku
Etinis klausimas yra atskiras. Daugelis muzikantų jaučiasi, kad DI muzikos generavimas kelia grėsmę jų pragyvenimui. Ir tai nėra nepagrįsta baimė – jei įmonės gali generuoti foninę muziką reklamoms, žaidimams ar filmams nemokamai, kam mokėti kompozitoriui? Tai realus ekonominis klausimas, kuris dar neturi aiškaus atsakymo.
Tačiau yra ir kita perspektyva: DI muzika gali demokratizuoti kūrybą. Žmogus, kuris turi idėją, bet neturi muzikinio išsilavinimo, dabar gali ją realizuoti. Tai panašu į tai, kaip fotografija nekužino tapybos – ji sukūrė naują kūrybinę erdvę.
Praktinis naudojimas – kur tai tikrai veikia
Pakalbėkime apie konkrečius naudojimo atvejus, kur DI muzikos generavimas duoda tikrą vertę:
Prototipavimas ir idėjų testavimas: Muzikantai ir prodiuseriai gali naudoti Suno ar Udio kaip greitą idėjų testavimo įrankį. Norite patikrinti, ar tam tikra nuotaika tinka jūsų projektui? Generuokite keletą variantų per 5 minutes, o ne praleiskite valandas studijoje.
Foninė muzika mažiems projektams: YouTube kanalai, podcast’ai, nedidelės reklamos, prezentacijos – visi šie projektai reikalauja muzikos, bet dažnai neturi biudžeto ją pirkti. DI generavimas čia yra tikras sprendimas.
Žaidimų kūrimas: Indie žaidimų kūrėjai gali generuoti atmosferinę foninę muziką savo projektams. Udio ypač gerai tinka šiam tikslui dėl galimybės kurti ilgesnius, koherenčius kūrinius.
Kūrybinis eksperimentavimas: Tiesiog smagu. Galite sukurti dainą apie savo katę, sugeneruoti metalinę versiją liaudies dainos arba pamatyti, kaip skambėtų jūsų mėgstama eilėraštis kaip 70-ųjų soul kūrinys. Tai kūrybinis žaidimas, ir jame nėra nieko blogo.
Muzikos pedagogika: Mokytojai gali naudoti DI generavimą kaip demonstracinį įrankį – parodyti, kaip skamba skirtingi žanrai, instrumentų deriniai ar harmoninės struktūros. Tai daug greičiau nei ieškoti tinkamų pavyzdžių YouTube.
Kai DI muzika tampa tuo, kuo ji turėtų būti
Suno ir Udio yra ne muzikos pabaiga – jie yra naujo skyriaus pradžia. Technologija dar nėra tobula: kartais vokalo žodžiai tampa nesuprantami, kartais struktūra tampa keista po pirmojo refreno, kartais instrumentai „ištirpsta” vienas kitame. Bet progresija per pastaruosius dvejus metus yra tokia sparti, kad sunku net prognozuoti, kur būsime po dar dvejų metų.
Svarbiausia suprasti: šie įrankiai yra tiek geri, kiek geras yra žmogus, juos naudojantis. Kaip ir su bet kokia kūrybine technologija – Photoshop nepadaro iš kiekvieno fotografo menininką, bet suteikia menininkui galingą įrankį. Tas pats čia.
Jei esate muzikantas – nenorėkite šios technologijos. Išmokite ją naudoti kaip papildomą įrankį. Jei esate kūrėjas be muzikinio išsilavinimo – tai yra jūsų galimybė realizuoti idėjas, kurios anksčiau buvo nepasiekiamos. Jei esate tiesiog smalsus žmogus – tiesiog pabandykite. Suno turi nemokamą planą, Udio taip pat. Sugaišite 15 minučių ir gausite kažką, kas prieš penkerius metus būtų atrodę kaip magija.
Muzikos kūrimas visada buvo apie tai, kaip žmonės perteikia emocijas ir patirtis. DI keičia kaip tai daroma, bet nekeičia kodėl. Ir kol žmonės norės kurti, dalintis ir jausti – tiek DI bus tik dar vienas instrumentas šiame amžiname procese.



