UMJETNA INTELIGENCIJA
My Music My Choice: zaštita glasa prije nego što AI napravi kopiju
AI krade glasove, klonira identitete i puni streaming platforme lažnim snimkama. Istraživači su pronašli način da to zaustave. Zove se My Music My Choice i logika je obrnuta od svega što je do sad predlagano
Moderni sustavi za kloniranje glasa trebaju svega nekoliko sekundi javno dostupnog materijala – intervju, live snimka, video – da izgrade model koji reproducira ton, boju, dikciju i emocionalne nijanse. Iz tog uzorka nastaje sintetska verzija koja distributeru i streaming algoritmu izgleda identično kao originalni izvođač. Sophie, koja je umrla 2021., dobila je lažne AI pjesme na svom Spotify profilu. Isto se dogodilo Blazeu Foleyu, umrlom davne 1989. Mrtvi se ne mogu žaliti. Živi mogu, ali rijetko znaju da postoji tehnički odgovor koji ne ovisi o pravnicima, platformama ni zakonodavcima.
Sony Music je ovog ožujka objavio da je do sad zatražio uklanjanje više od 135.000 lažnih snimaka s platformi za streaming, od kojih je samo od ožujka prošle godine identificirano gotovo 60.000 – sve naslovi koji lažno tvrde da sadrže izvođače iz njihovog kataloga. Beyoncé, Queen, Harry Styles, Bad Bunny. „U najgorim slučajevima, lažne snimke mogu oštetiti kampanju objave albuma ili naškoditi ugledu izvođača“, rekao je Dennis Kooker, predsjednik Sonyjevog globalnog digitalnog poslovanja. I dodao nešto što govori više od samih brojeva: problem je uvijek najgori upravo kad je izvođač aktivan, kad promovira novu glazbu, jer lažne snimke parazitiraju na potražnji koju je sam stvorio. Sony napominje da 135.000 vjerojatno nije ni blizu stvarnom broju onoga što trenutno cirkulira.
Nije ovo izolirani slučaj jedne korporacije s resursima za sustavno praćenje. Kad je alternativni rock sastav King Gizzard and the Lizard Wizard prošle godine uklonio svoju glazbu sa Spotifyja, gotovo su istog trenutka na platformi niknule snimke sličnog zvuka, sličnih naziva – sintetski nadomjestak koji je popunio prazninu prije nego što ju je algoritam i primijetio. Spotify je u jednoj godini uklonio 75 milijuna lažnih naslova. Sanacija umjesto prevencije, uvijek korak iza jer svaki uklonjeni klon ima vremenski prozor u kojem je bio aktivan i razrjeđivao zajednički fond naknade iz kojeg dolaze honorari stvarnih autora.
Dosad je standardni odgovor bio reaktivan: digitalni vodeni žig, detekcija, prijava, uklanjanje. Detektiraš klon nakon što nastane, dokaže se da nije tvoj, platforma ga ukloni. Logika je ispravna. Problem je u tome što je ta logika dizajnirana za industriju u kojoj lažnih snimaka ima milijun i pol godišnje.
Na NeurIPS 2025 radionici posvećenoj umjetnoj inteligenciji i glazbi, istraživači s Binghamton Universityja u suradnji sa startupom Cauth AI predstavili su drukčiji pristup. Zove se My Music My Choice i logika je obrnuta od svega što je do sad predlagano.
Umjesto da detektira klonove nakon što nastanu, sustav modificira originalni zvučni zapis prije distribucije, na način nevidljiv ljudskom uhu, ali dovoljan da svaki pokušaj kloniranja producira neupotrebljiv rezultat. Nije to degradacija snimke. Zaštićena verzija ostaje perceptivno nepromijenjena za slušatelja – originalna snimka zvuči kao glazba. Klon koji pokuša reproducirati taj glas zvuči kao da je nešto pošlo naopako u procesnom lancu. Jer jest.
Sustav istovremeno rješava četiri proturječna cilja: snimka mora ostati bliska originalu, mora zvučati perceptivno nepromijenjena ljudskom uhu, mora maksimalno dezorijentirati sustav za kloniranje i klon mora postati semantički nerazumljiv – ne samo bučan. Voditelj istraživanja Umur Aybars Ciftci opisuje cilj kao pronalaženje minimalnih izmjena koje čovjek ne čuje, a koje potpuno zbunjuju strojeve za kloniranje. Minimalan utjecaj na slušatelja, maksimalan poremećaj za strojeve.
Ključni detalj koji sustav čini praktično primjenjivim: zaštita se ugrađuje direktno u vokalni zvučni zapis, ne u ukupni audio miks, i opstaje kad se zaštićeni vokal editira u kompletnu snimku s instrumentalnom podlogom. Zaštita opstaje u finalnom miksu. I ne zanima je koji alat napadač koristi: svejedno je radi li se o komercijalnom servisu, otvorenom modelu s GitHuba ili nečem što još nije objavljeno. Istraživanje je testirano na 150 snimaka koje pokrivaju pop, rock i world music; žanrovski raznovrstan materijal kakav autori stvarno objavljuju.
Digitalni vodeni žig i detekcija ostaju i dalje relevantni kao nadopuna – dokaz autorstva nakon nastanka problema, forenzički trag u slučaju spora. Istraživači sami postavljaju otvoreno pitanje hoće li se proaktivna zaštita zvučnog zapisa i reaktivni vodeni žig eventualno kombinirati u jedinstven distribucijski proces. Kombinacija bi bila kompletna arhitektura: snimka koja se ne može klonirati, a ako se pokuša, nosi kriptografski dokaz neautentičnosti klona.
Dosad je zaštita glasa bila privilegija onih s pravnim timovima i novcem. My Music My Choice sugerira da ne mora biti isključivo tako. Hoće li i kad doći do ugradnje u standardne distribucijske alate i produkcijske dodatke pitanje je volje, ne tehnike.
Sony je za uklanjanje 135.000 snimaka trebao cijeli pravni odjel, ugovore s platformama i godišnju bitku s algoritmima i na kraju dobio samo privremenu prednost. Binghamton istraživači i Cauth AI predlažu drukčiju logiku: zaštiti glas prije nego što ga netko ukrade. Jedan zvučni zapis, jedan upload, jedna snimka koja izlazi u svijet s glasom izvođača – i samo njegovim. Prvi put, ta mogućnost nije rezervirana samo za one koji si mogu priuštiti armiju odvjetnika i AI laboratorije.