====== Tehnike za watermarking audio zapisa ====== ===== Sažetak ===== //Watermarking// je stara metoda kojom su se sakrivale informacije na još vlažnom papiru. Večinom se koristi za zaštitu autorskih prava, intelektualnog vlasništva i zaštitu od krivotvorenja. Kod audio zapisa //watermarkovi// se u same podatke ugrađuju, pokušavajući postići kompromis između robusnosti na pokušaje brisanja ili promjene, i održavanja visoke kvalitete zvuka i neprimjetnosti promjena. Pri tome, različite metode su bolje u različitim primjenama, dok neke metode, kao metode raspršivanja spektra, su ranjiive na specifične promjene, druge metode, kao što su metode skrivanja odjeka, nisu dobre u očuvanju izvornog zvuka, dok treće metode generalno nemaju loše strane, ali se one javljaju kod specifičnih implementacija. ===== Uvod ===== //Watermarking// je tehnika kod koje se neprimjetnom izmjenom određenog predmeta ili podataka, spremaju informacije o tom predmetu ili podacima. Najranija poznata uporaba takvih tehnika javlja se u Italiji, u 13. stoljeću, kada se mijenjala debljina još vlažnog papira, kako bi se određena poruka ili žig vidjeli pod određenom svijetlošću ili sjenom. Poznate koristi sličnih metoda su na novčanicamam, kako bi se zaštitile od krivotvorenja, tj. kako bi se krivotvorine lakše prepoznale, i na fotografijama.[4][7][8] Danas, s proširenjem digitalne tehnologije, pristup velikim količinama različitih podataka, u tekstualnom, video ili audio obliku, sve je lakši. Također, podaci se mogu vrlo jednostavno i brzo izmjenjivati koristeći današnje kompresijske metode, što je također omogučilo ljudima da izmjenjuju i, preko Interneta, šire ilegalne kopije podataka koji se smatraju zaštičenim, intelektualnim vlasništvom. Zbog toga, se razvijaju tehnike za zaštitu autorskih prava digitalnih podataka.[3][4] Slično kao steganografija, //watermarking// digitalnih podataka pokušava sakriti određene informacije u samim podacima, međutim uz određene, dodatne zahtjeve koji su pristuni i običnom, nedigitalnom //watermarkingu//. Općenito, možemo reći da //watermarking// stvara poveznicu između čistih podataka i odgovarajuće informacije. Ta poveznica može služiti različitim svrhama. Prema tome možemo ih podijeliti u dvije kategorije: * ''Javni'' - Koriste se kao nositelji informacija, svatko ih može pročitati. Ne smiju se moći izbrisati ili modificirati (osim od autora samog //watermarka//), međutim ovaj zahtjev može biti manje bitan ako se koriste samo kao poveznice informacija. * ''Tajni'' - Mogu se koristiti za autentifikaciju i utvrđivanje integriteta podataka na različite načine. Pristup informacijama imaju samo oni koji znaju o tajnome //watermarku//. [1][2][3][7] Ovaj se rad fokusira na neke od tehnika koje se koriste za //watermarking// audio zapisa. ===== Audio watermarking ===== Kažemo da je **audio watermark** jedinstven, elektronički identifikator ugrađen u audio signal. Tipično se koristi za provjeru i/ili zaštitu vlasništva autorskih prava. Ugrađivanje nekog skrivenog signala ili //watermarka// u podatke u audio zapis potencijalno se može upotrijebiti za upravljanje pristupa, tj. upravljanje načinom korištenja samog audio zapisa. Međutim, dodavanjem dodatnih signala, ili izmjenom već postojećih, i uz sam koncept watermarkinga, javljaju se dodatni problemi i zahtjevi: * __Neprimjetnost i kvaliteta__ - Neki ljudi smatraju da se originalni zvuk ne bi smio mijenjati i da treba još mnogo napredaka kako bi se smatralo to savršenim digitalnim zvukom, tj. rješenjem. Ljudski slušni sustav ne bi smio primjetiti, ili smije minimalno primjetiti, ugrađeni //watermark// signal, uz što bolje očuvanje početnog audio zapisa. * __Ugrađenost__ - //Watermark// signal mora biti ugrađen unutar samih podataka umjesto u zaglavlju ili određenom "omotaču". * __Robusnost__ - //Watermark// mora biti otporan na značajne promjene i degradacije sadržaja, kao što je dodavanje šuma ili filtriranje, kako bi se spriječio neovlašteni pristup podacima. * __Pouzdanost__ - Sustav koji koristi //watermarking// za kontrolu pristupa mora na brz i pouzdan način pronaći i obraditi //watermark// u audio zapisu. [1][2] Kako bi se ispunio zahtjev kvalitete i neprimjetnosti, kod audio //watermarkinga//, algoritmi se tipično prilagođavaju ljudskom slušnom sustavu, pri čemu se koriste određene tehnike koje ljudi teže zapažaju. Na primjer, utvrđeno je da ljudski slušni sustav nije osjetljiv na jeku, prema tome određene metode su razvijene koje koriste ponavljanje audio signala u jako malom vremenskom okviru tako da bude nezamjetno ljudskom uhu.[1] Svaka metoda pokušava uravnotežiti dodanu energije kroz //watermark// i njegovu opažljivost. Ostali se zahtjevi večinom ispunjavaju matematičkim podlogama koje se koriste u samim algoritmima, tj. metodama audio //watermarkinga//. Iz tih tih matematičkih podloga algoritama, dobivamo podjelu tehnika audio //watermarkinga// s obzirom na domenu u kojoj modificiraju zapis. Prema tome, imamo metode: * **Vremenske domene** * Dodavanje šuma - //Watermark// se dodaje toku audio podataka kao singal male amplitude * Dodavanje jeke - Kako je već opisano, ponavlja se određeni signal, uz smanjenu amplitudu, unutar vrlo kratkog vremenskog okvira(20 ms). * Modifikacije faze - Ljudski slušni sustav ne primjećuje relativnu ni apsolutnu fazu signala, zbog čega se ovaj tip metoda razvio. Iako zahtjevaju Fourierovu transformaciju za implementaciju, smatraju se metodama vremenske domene. * Amplitudna modulacija - Dodavanje signala dovoljno niske amplitude da ih ljudski slušni sustav ne može primjetiti unutar komponenata audio signala koji se modificira. * **Frekvencijske domene** * Frekvnecijska modulacija - Slanje informacija, tj. //watermarka//, izmjenom frekvencija zvučnih signala zapisa. Večinom nesigurni sustavi. * Dodavanje šuma u transformiranoj domeni * Oduzimanje frekvencijskih opsega * Kombinacije spomenutih metoda * "Enkodirane" domene * Dodaje se šum koeficijentima enkodiranja - Podaci //watermarka// se dodaju koeficijentima enkodiranja kod transformacije. Ponekad, alternativno, koeficijenti se mijenjaju po (pristranoj) distribuciji pogreške. Obje metode su korištene u MPEG, AC3 i nekim drugim metodama. [1][2] ==== Metoda raspršivanja spektra ==== Jedna od popularnijih metoda koja koristi frekvencijsku modulaciju izmišljenu u Njemačkoj za sigurnu, vojnu komunikaciju. Ona pokušava rasprišti signal koji prenosi //watermark// po cijelome zvučnom, frekvencijskom spektru, time pokušava imitirati nečujan //bijeli šum//. Za to koristi četiri različita signala: * ''Originalni signal'' - Prenosi zvuk iz audio zapisa. * ''Prijenosni val'' - Sinusni val s predodređenom frekvencijom. * ''Ključ ili "Čip" (eng. "Chip")'' - Signal koji se sastoji od pseudo slučajnog slijeda šuma. Potreban za enkodiranje i dekodiranje //watermarka//. Poprima diskretne vrijednosti (-1, 1). * ''Binarni niz'' - //Watermark// koji želimo ugradit u obliku signala. Također, poprima diskretne vrijednosti (-1, 1). Primjer takvih valova može se vidjeti na sljedećoj slici: {{:racfor_wiki:signali_spread_spectrum.png?400| Enkodiranje watermarka kod metode rasprišivanja spektra. Prijenosni val se množi s pseudo slučajnim ključem i binarnim kodom watarmarka čime se dobiva enkodirani signal (Coded waveform). [2] }} Za ugrađivanje //watermarka// ovom metodom, prvo je potrebno pomnožiti amplitude vala nosača, ključem i binarnim nizom uzorak po uzorak, u vremenskoj domeni. Time se raspršuje spektar rezultirajućeg vala po širokom frekvencijskom opsegu, čime se postižu karaktiristike slučajnog šuma. Tada se enkodirani valni oblik (signal) oslabljuje na polovicu dinamičkog raspona izvornog signala (signala audio podataka) i dodaje izvornom signalu. Kod obrnutog postupka, tj. otkrivanja //watermarka//, signal ključ mora biti poznat sustavu za detekciju(dekodiranje), mora imati ravan frekvencijski spektar i ne smije se ponavljati u velikom vremenskom rasponu, signali moraju biti sinkronizirani u vremenskoj domeni, poznat je početak i kraj enkodiranih podataka //watermarka//. Također, moraju biti poznata brzine prijenosa binarnog niza //watermark// podataka i signala ključa, i zadnje, frekvencija vala nosača. Sam dohvat se radi filtriranjem dobivenog enkodiranog signala, najčešće funkcijom korelacije s poznatim pseudo slučajnim signalom ključem. [1][2] Ova metoda ima još dodatna poboljšanja, kao na primjer, korištenjem percepcijskom maskiranja. Taj efekt se postiže istovremenim emitiranjem dva zvučna signala sličnih frekvencija(simultano maskiranje) ili emitiranjem jednog neposredno nakon drugog(vremensko maskiranje). Ljudsko uho nije osjetljivo na takve signale, tj. modifikacije zvučnog zapisa, pa se zbog toga taj fenomen koristi i u MP3 i sličnim formatima. Postoje i druga poboljšanja, međutim metoda raspršivanja spektra se kroz različita istraživanja pokazala dosta robusnom i korisnom, pa se iz tog razloga često koristi. Međutim, ovakve metode imaju specifičnu ranjivost na bilo kakvu modifikaciju vremenske domene, specifično, na vremenske pomake i frekvencijska skaliranja. [1][2][5] ==== Metode skrivanja odjeka ==== Kako je već spomenuto u uvodu, ljudsko uho teško detektira jeku, tj. ponavaljanje signala, ako se događa u dovoljno malom vremenskom okviru nakon izvornog signala. Različite metode su se razvile iz toga fenomena, ovaj rad se fokusira na metodu s jednim dodanim odjekom. [2] === Metode s jednim dodanim odjekom === Metode s jednim odjekom dodaje jedan signal jeke(odjeka) s pozitivnom amplitudom za svaki bit //watermarka//. Vrsta bita (0 ili 1), se prepoznaju s različitim vremenimam kašnjenja, jedno predstavlja "0", a drugo "1". Prema tome, za ugrađivanje //watermark// podataka u izvorni audio signal koriste se dvije jezgrene (kernel) funkcije, svaka od kojih sadrži diskretan vremenski impuls. Izvorni signal se dijeli na manje sekcije u vremenu i radi se konvolucija s jezgrenim funkcijama dane sekcije. Prvi impuls jezgrene funkcije kopira originalni signal, a drugi stvara jeku. Za svaku jezgrene funkciju koriste se različite amplitude i kašnjenja. Primjer funkcija dan je na sljedećoj slici: {{:racfor_wiki:kerneli_echo.png?400| Jezgrene funkcjie kod metode dodavanja odjeka [2] }} Kod dohvata //watermarka//, isto kao kod ugrađivanja, dobiveni signal se dijeli na sekcije i pokušavaju se detektirati vremenski razmaci između odjeka čime se dohvaća binarni niz, tj. sam //watermark//. Metode skrivanja odjeka mogu biti neuporabljive kada se koriste nad glazbenim zapisima jer mogu uvesti dodatnu rezonancu i time izmjeniti način na koji ljudi percipiraju dani audio signal. Također, kod ovakvih metoda problem je u audio zapisima s relativno velikim periodima tišine, jer tada se neće nikakva jeka proizvesti i time se neće ugraditi/enkodirati //watermark//. Međutim, mnoga istraživanja pokazuju da večina ovakvih metoda ima dovoljno visoku stopu detekcije i oporavka //watermarka//. Također, postoje i metode više odjeka, koje pokušavaju zaobiči neke probleme metoda s jednim odjekom, ali one daju slične rezultate i probleme kod glazbenih audio zapisa.[1][2] ==== Metode watermarkinga niskim frekvencijama ==== Ove metode dijele određene sličnosti s metodama rasprišvanja spektra, ali koriste ugrađivanje signala niskih frekvencija u izvorne signale. Kod ugrađivanja, izvorni se signal dijeli u segmente koji sadrže po ''N'' uzoraka. Generira se pseudo slučajan niz diskretnih vrijednosti -1 i 1, koje se koriste kao //**ključ**// //watermarka//. Pseudo slučajan ključ se tada oslabljuje predodređenom faktorom i modulira segmentom izvornog audio signala. Rezultat toga propušta se kroz niskopropusan Hammingov (Prozorni) filter i dodaje segmentu izvornog signala. Time dobivamo, nečujni audio //watermark//. Nakon što se postupak provede za svaki segment, dobiva se //watermarkan// audio zapis. Kod detekcije i oporavka //watarmarka//, dijelimo signal ponovno na segmente od N uzoraka, pri čemu pseudo slučajan ključ mora biti poznat. Radi se usporedba korelacije između enkodiranog signala i //watermarka//, uz bilo kakav cirkularni pomak, i korelacije između izvornog signala i //watermarka//. Ako maksimalni rezultat te usporedbe, kroz sve segmente je veći od predodređenog praga tada smo detektirali //watermark//. Za razliku od metoda skrivenih odjeka, ove metode ne dovode do specifičnih problema kod glazbenih zapisa, a njihova robusnost u generalnom je slučaju vrlo visoka. Međutim, kod specifičnih implementacija ovakvih metoda mogu se javiti različite ranjivosti na specifične modifikacije audio signala, čime se //watermarkovi// mogu izbrisati. [2] ===== Zaključak ===== Možemo vidjeti da u današnje vrijeme velika je potražnja za mehanizmima očuvanja autorskih prava i intelektualnog vlasništva. Specifično kod audio zapisa, ne postoji savršeno rješenje, ali možemo vidjeti da su nam različite metode korisne u različitim situacijama. Od tri različitih vrsta metoda koje su spomenute u ovome radu, vidimo da svaka ima svoje prednosti i nedostatke. Najveći izazovi javljaju se kod napada modifikacijom vremenske skale, koji uzrokuju probleme sinkronizacije, a time i oporavka //watermarka//, na koje su specifično ranjive metode raspršenog spektra. Također, veliki izazov predstavlja postizanje dobrog kompromisa između robusnosti //watermarka// i neprimjetnosti dodanog signala. Ovo je specifično problem zato što ljudi zahtjevaju "čisti" zvuk, dok glazbena industrija želi zaštiti svoje intelektualno vlasništvo. Prema tome, vidimo da nema savršenih metoda koje rješavaju sve probleme, međutim ima metoda koje mogu se vrlo dobro primjenit u specifičnim slučajevima, s određenim kompromisima. ===== Literatura ===== [1] M. Hrnčár, J. Krajčovič [[https://core.ac.uk/download/pdf/8986876.pdf|Principles of Audio Watermarking]]. [2] Stephan Wiefling [[https://www.researchgate.net/publication/316192889_Comparison_of_Audio_Watermarking-Techniques|Comparison of Audio Watermarking Techniques]] ožujak 2016. [3] Michael Arnold [[https://www.researchgate.net/publication/3864166_Audio_watermarking_features_applications_and_algorithms|Audio watermarking: features, applications and algorithms]] veljača 2000. [4] Hebah H. O. Nasereddin [[https://www.researchgate.net/publication/228450058_DIGITAL_WATERMARKING_A_TECHNOLOGY_OVERVIEW|Digital Watermarking A Technology Overview]] veljača 2011. [5] Henrique Malvar, Darko Kirovski [[https://www.researchgate.net/publication/3318571_Spread-Spectrum_Watermarking_of_Audio|Spread Spectrum Watermarking for Audio]] svibanj 2003. [6] Sascha Zmudzinski, Martin Steinebach, Stefan Katzenbeisser, Ulrich Rührmair [[https://www.researchgate.net/publication/221210695_Audio_Watermarking_Forensics_Detecting_malicious_re-embedding|Audio Watermarking Forensics Detecting malicious re-embedding]] veljača 2010. [7] Anastasios Tefas, Nikos Nikolaidis, Ioannis Pitas [[https://www.sciencedirect.com/science/article/pii/B978012119792650125X|Watermarking techniques for Image Authentication and Copyright Protection]]. [8] Meggs, Philip B. (1998). A History of Graphic Design (Third ed.). John Wiley & Sons, Inc. p. 58. ISBN 978-0-471-29198-5.