Sadržaj

Alati za ekstrakciju i uređivanje metapodataka datoteka

Sažetak

Metapodaci su široko korišteni pojam koji se odnosi na podatke o podacima. Metapodaci se koriste za opis karakteristika, podrijetla, strukture i drugih informacija datoteka. Time olakšavaju organizaciju, indeksiranje, otkrivanje, pristup, analizu i upotrebu podataka.

Sa stajališta računalne forenzike, metapodaci mogu biti vrlo korisni kao dokaz ili za analizu krivotvorenih i mijenjanih datoteka. Također su korisni kod zaštite autorskih prava, ali mogu predstavljati razne sigurnosne rizike zbog osobnih informacija skrivenih među njima.

Za pisanje, analizu i obradu metapodataka dostupni su razni alati kao što su ExifTool, ExifTool GUI, AnalogExif, Exif Pilot i Metadata++.

Ključne riječi: metapodaci; EXIF; analiza; alati

Uvod

Metapodaci (engl. metadata) se koriste posvuda – oni digitalni trag svega što radimo u informacijskom prostoru. Istog trenutka kada se prebacujemo u digitalni svijet, pojavljuje se pojam metapodataka. Oni prikazuju supstancu, kvalitetu, stanje i različite atribute podataka te pomažu u pronalaženju, upravljanju i organizaciji resursa.

Metapodatke ne nalazimo samo na računalima i u digitalnim okruženjima. To je zapravo nova riječ koja se temelji na starom konceptu. Bilo koja knjiga u tradicionalnoj knjižnici sadrži metapodatke kao što su pisac, naslov, distributer, šifra i naslov predmeta.

Metapodaci su vrijedni gotovo jednako kao i sami podaci koje opisuju jer osiguravaju da se oni mogu pronaći, koristiti, sačuvati i ponovno koristiti u budućnosti.

O metapodacima

Metapodaci se često nazivaju informacije o informacijama ili podaci o podacima [4]. Preciznije rečeno, metapodaci su strukturirane informacije koje lociraju, objašnjavaju i opisuju druge podatke te na taj način olakšavaju njihovu upotrebu, pristup i upravljanje njima.

Metapodaci obuhvaćaju vrijeme i datum nastanka ili zadnje izmjene datoteke, autora podataka, veličinu datoteke, kvalitetu podataka, program ili procese korištene za njihovo stvaranje, tip datoteke itd.

Različiti tipovi datoteka mogu sadržavati različite metapodatke ili dodatna polja osim nekih generalnih informacija o datoteci. Primjerice, digitalne fotografije mogu sadržavati informacije poput marke i modela fotoaparata, razlučivost slike, koordinate na kojima je fotografija snimljena, naziv programa korištenog za uređivanje fotografije, postavke fotoaparata kao što su ISO brzina, brzina zatvarača, balans bijele boje, vrsta leće i slično. S druge strane, video datoteke mogu imati trajanje videozapisa, informacije o titlovima te podatke o kvaliteti podataka kao što su frame rate, broj megapiksela i dimenzije videozapisa. Tekstualne datoteke obično sadrže ime autora datoteke, broj linija teksta, broj riječi u dokumentu ili slično, dok zvukovne datoteke često imaju dodatne metapodatke kao što su naziv pjesme, ime izvođača, naziv albuma, žanr i godina nastanka.

Uloge metapodataka

Metapodaci pomažu pri otkrivaju resursa jer omogućavaju pretraživanje prema relevantnim kriterijima. Služe za prepoznavanje resursa, okupljanje sličnih resursa i razlikovanje različitih resursa [4]. Osim toga, poboljšavaju kvalitetu i količine rezultata upita, pospješuju organizaciju resursa, ubrzavaju pronalaženje podataka te omogućuju sigurno arhiviranje i čuvanje podataka.

Vrste metapodataka

Postoji velik broj metapodataka ovisno o njihovoj namjeni, formatu, kvaliteti i opsegu. Neke od široko korištenih kategorija metapodataka su opisni, strukturni i administrativni metapodaci [1].

Opisni metapodaci (engl. Descriptive metadata) služe kao detaljnije informacije o bilo kojoj vrsti datoteke. Primjerice, mogu uključivati naslov, ključne riječi, opise i slično. Ova vrsta metapodataka uključuje skup informacija koje opisuju sredstvo te se mogu koristiti za njegovu identifikaciju i pretraživanje. To uključuje jedinstvene identifikatore, fizičke atribute (npr. dimenzije datoteke) i bibliografske atribute (npr. autor, naslov i ključne riječi).

Strukturni metapodaci (engl. Structural metadata) opisuju detalje o načinu upravljanja datotekama. Strukturni metapodaci pokazuju kako su datoteke organizirane. Osim toga, ova vrsta metapodataka je ključna za dokumentiranje odnosa između dvaju resursa.

Administrativni metapodaci (engl. Administrative metadata) odnose se na tehničke informacije o digitalnoj datoteci. Uključuju podatke poput vrste datoteke te kada i kako je ona stvorena. Osim toga, ovi metapodaci sadrže i informacije koje se odnose na intelektualno vlasništvo i prava korištenja datoteke.

Stvaranje i pronalazak metapodataka

Metapodaci se mogu stvoriti automatiziranom obradom podataka ili ručno od strane korisnika. Metapodaci koji su stvoreni automatski uključuju tip i veličinu datoteke, datum nastanka, autora i slično. S druge strane, ručna izrada metapodataka korisnicima omogućuje unos dodatnih informacija o datoteci poput njezinog opisa i ključnih riječi, čime se povećava preciznost metapodataka.

Osim toga, metapodaci u digitalnoj datoteci mogu biti vidljivi ili skriveni. Vidljive metapodatke jednostavno može pronaći svaki korisnik – primjerice desnim klikom miša na datoteku i odabirom opcije Properties. Ovo obuhvaća neke opće podatke o datoteci poput vrste datoteke, njezine veličine te datum i vrijeme kada je stvorena ili izmijenjena. Osim spomenutih vidljivih metapodataka, svaka datoteka sadrži i niz skrivenih metapodataka. Ovakvi skriveni metapodaci mogu uključivati sigurnosne postavke datoteke, podatke o njezinoj pohrani i slično. Pronalaženje skrivenih metapodataka moguće je pomoću raznih alata, koji uz to pružaju i mogućnosti njihove obrade i izmjene. U nastavku ovog rada razrađene su značajke nekoliko takvih alata.

Alat ExifTool

Alat ExifTool je konzolna (command-line) aplikacija za čitanje, pisanje i uređivanje metapodataka raznih vrsta datoteka. Alat podržava mnoštvo različitih formata zapisa metapodataka uključujući EXIF, GPS, IPTC, XMP, JFIF, GeoTIFF, ICC Profile, Photoshop IRB, FlashPix, AFCP itd. [2] Osnovne funkcionalnosti ovog alata su sljedeće:

Alat se koristi pozivom naredbe exiftool. Uz to se navode i neke od dostupnih opcija te na kraju ime jedne ili više datoteka ili direktorija. U nastavku je prikazan općeniti oblik ove naredbe kakva se koristi u naredbenom retku.

exiftool [OPTIONS] [-TAG...] [--TAG...] FILE...

Primjerice, osnovna naredba kojom je moguće ispisati sve dostupne metapodatke iz zadane datoteke koristi se na sljedeći način:

exiftool ime_datoteke.jpg

Na sljedećoj je slici prikazan primjer ispisa ove naredbe nad slikovnom datotekom.

Slika 1: Ispis alata ExifTool

Na prikazanom je primjeru korištena najosnovnija naredba ekstrakcije metapodataka, čime su ispisani svi poznati metapodaci za zadanu datoteku.

Definiranjem dodatnih opcija moguće je zadati koja da se polja ispišu, uređivati, brisati ili dodavati nova polja te još mnogo toga.

Jedna od takvih opcija je opcija common za ispis samo često koriištenih polja metapodataka. Također je moguće navesti imena specifičnih oznaka koje je potrebno ispisati. To su primjerice CreateDate, ShutterSpeed, ImageSize i ExposureTime.

Osim jednostavnih ispisa metapodataka pojedinih datoteka, moguće je provoditi i naprednije naredbe poput formatiranog ispisa, ispisa u određenu destinacijsku datoteku, zadavanje datoteka kao regularnih izraza i slično.

Sljedeći primjer ispisuje formatirani datum i vrijeme za sve datoteke ekstenzije JPG u trenutnom direktoriju te ih ispisuje u destinacijsku tekstualnu datoteku.

exiftool -d "%r %a, %B %e, %Y" -DateTimeOriginal -S -s *.jpg > out.txt

Osim same ekstrakcije metapodataka datoteke, moguće je pisati i izmjenjivati i dodavati nova polja. Ovo je moguće navođenjem imena željenog polja i vrijednosti na koju to polje želimo postaviti. Slijedi primjer upisa imena autora u polje Artist slikovne datoteke.

exiftool -artist="Artist Name" ime_datoteke.jpg

Korisno je napomenuti da pri mijenjanju metapodataka ExifTool čuva izvornu datoteku dodavanjem naziva _original u naziv datoteke, kako bi se pri neželjenim pogreškama mogla vratiti stara verzija.

Osim pisanja metapodataka u samo jednu datoteku, moguće je jednom naredbom obraditi definirani skup datoteka. To je moguće nabrajanjem imena željenih datoteka odvojenih razmakom ili navođenjem imena direktorija. Sve navedene datoteke ili datoteke koje se nalaze unutar zadanog direktorija bit će obrađene na isti način. Na primjeru je prikazano postavljanje polja Author na jednaku vrijednost za sve datoteke u definiranom direktoriju.

exiftool -artist="Artist Name" c:/images

Osim skupne obrade više datoteka, odjednom je moguće i pisati u višestruka polja, što je prikazano na sljedećem primjeru.

exiftool -artist="Artist Name" -copyright="2021 Artist Name" datoteka.jpg

Također, moguće je prepisivati metapodatke iz jedne datoteke u drugu pomoću opcije tagsFromFile. Nakon imena izvorne datoteke navode se oznake koje se žele kopirati destinacijsku datoteku. Na primjeru je ilustrirano kopiranje polja DateCreated iz jedne slikovne datoteke u drugu.

exiftool -tagsFromFile src.jpg -DateCreated dst.jpg

Ukoliko se ne navede niti jedna oznaka, sva polja za koja ExifTool ima prava izmjene bit će prepisana vrijednostima polja iz izvorne datoteke.

Metapodatke datoteke također je moguće brisati, što može biti korisno za zaštitu privatnosti korisnika. Kako bi se uklonili svi metapodataci datoteke potrebno je izvesti sljedeću naredbu:

exiftool -all= ime_datoteke.jpg

Postoji još veliki broj opcija i metoda koje alat ExifTool pruža za obradu metapodataka datoteka. Ovaj alat je jednostavan za instalaciju, brz i efikasan, pruža velik broj funkcionalnosti te podržava širok spektar tipova datoteka. Za osnovnu uporabu vrlo je jednostavan, no za naprednije obrade metapodataka potrebno je proučiti dokumentaciju, kako bi se maksimalno mogle iskoristiti brojne mogućnosti koje pruža.

Alat ExifTool GUI

ExifTool je alat koji pruža mnogo funkcionalnosti. Omogućava ekstrakciju velikog broja metapodataka te uređivanje gotovo svakog od njih. Jedini nedostatak je činjenica da je to alat naredbenog retka i sam po sebi ne pruža korisničko sučelje. Naravno, takav pristup mu pruža veliku fleksibilnost, no nekim korisnicima to može otežati uporabu. ExifTool GUI nastao je s ciljem da iskoristi najbolje od oba svijeta. Alat pruža jednostavno sučelje koje omogućuje sljedeće funkcionalnosti:

Korisničko se sučelje ovog alata sastoji od sljedeća tri dijela: popisa direktorija na lijevoj strani, popisa datoteka odabranog direktorija u sredini te prikaza metapodataka za odabranu datoteku na desnoj strani zaslona (prikazano na slici).

Slika 2: Pregled metapodataka u alatu ExifTool GUI

Za pregled metapodataka željene datoteke jedino što je potrebno učiniti je odabrati datoteku i na desnoj će se strani prikazati popis svih njezinih poznatih metapodataka, grupiranih prema standardima. Svaki je od tih polja metapodataka moguće odabrati, te na dnu popisa izmijeniti njegovu vrijednost, kao što je prikazano na slici.

Slika 3: Izmjena vrijednosti polja

Za skupno uređivanje više datoteka, potrebno je označiti željene datoteke s popisa i na jednak način kao i kod jedne datoteke im promijeniti željena polja. Nakon spremanja izmjena, sve će odabrane datoteke imati jednaka izmijenjena polja.

Kopiranje metapodataka iz jedne datoteke u drugu moguće je iz opcije izbornika Export/Import i odabirom Copy metadata from single file. Nakon toga je potrebno odabrati izvornu datoteku i potvrditi kopiranje.

Opcija Export/Import također služi i za izvoz metapodataka odabrane datoteke ili skupa datoteka u jedan od sljedećih formata: TXT, MIE, XMP, EXIF ili HTML datoteku.

Brisanje metapodataka datoteka također je vrlo jednostavno. Potrebno je u izborniku odabrati opciju Modify i zatim Remove Data. Nakon toga je moguće odabrati željena polja za brisanje ili pak odabrati opciju remove all metadata (prikazano na slici).

Slika 4: Brisanje metapodataka

Alat također nudi mnoštvo opcija za prilagođavanje. Ovo uključuje hoće li se:

ExifTool GUI odlična je opcija za korisnike koji žele iskoristiti brojne funkcionalnosti alata ExifTool, a pritom preferiraju njihovo izvođenje putem korisničkog sučelja.

Ostali alati

Osim spomenuta dva alata, postoji još mnoštvo drugih alata za ekstrakciju i uređivanje metapodataka datoteka. Neki od njih su AnalogExif, Exif Pilot i Metadata++.

AnalogExif besplatni je alat za uređivanje metapodataka digitalnih fotografija i videozapisa. Omogućuje izmjenu većine polja EXIF, IPTC i XMP metapodataka za JPEG i TIFF datoteke. Pruža mogućnosti skupne obrade datoteka i kopiranje metapodataka iz jedne datoteke u drugu. Također omogućuje skup prilagođenih oznaka metapodataka.

Exif Pilot također je alat manipulaciju metapodacima slikovnih datoteka. Omogućuje pregled, uređivanje i brisanje EXIF, EXIF GPS, IPTC i XMP metapodataka i dodavanje novih polja. Osim toga, pruža mogućnost uvoz ili izvoza u XML, MS Excel ili CSV datoteke.

Metadata++ je moćan i jednostavan alat za pregled, uređivanje, izmjenu, izvoz i kopiranje metapodataka različitih formata datoteka. Podržava slikovne datoteke, video i audio zapise, tekstualne datoteke i još mnogo toga.

Dakle, svaki od ovih alata pruža osnovne operacije poput ispisa metapodataka odabrane datoteke, uređivanja odabranog polja, dodavanja polja i brisanja metapodataka. Iako su alati slični za osnovnu uporabu, svaki od njih ima drukčije mogućnosti koje pruža kod naprednijih obrada metapodataka.

Primjena u forenzičkoj analizi

Metapodaci mogu biti vrlo korisni za otkrivanje informacija u forenzičkoj analizi jer govore više o datoteci nego što su ljudi ponekad svjesni. Primjerice, fotografija može poslužiti kao dokaz da je osoba bila na određenoj lokaciji u određeno vrijeme. Pri tome bi se koristili GPS lokacija uređaja na kojemu je fotografija nastala, datum i vrijeme nastanka itd. Također je moguće otkriti jesu li podaci namjerno promijenjeni i krivotvoreni, postoje li neke nekonzistentnosti među metapodacima te proučiti tragove izmjene podataka te kada i tko ih je mijenjao.

Provjera vjerodostojnosti datoteke

Kao što je već spomenuto, fotografija može predstavljati dokaz koji mogao potvrditi da je osoba bila u određeno vrijeme na određenoj lokaciji, dokaz djela ili slično. No, digitalna fotografija može se uzeti u obzir kao valjani dokaz jedino kada bi ona bila originalna – mora se dokazati da nije izmjenjivana ni krivotvorena.

U ovu svrhu mogu poslužiti metapodaci i alati za njihovu analizu. Pomoću EXIF podataka slike moguće je proučiti datum izmjene, korišteni softver, autora koji je mijenjao datoteku, sličicu thumbnail i slično. Kako bi se provjerilo je li bilo koja datoteka izmjenjivana, najjednostavnije je pogledati polje sa zadnjim datumom izmjene (Modify Date). No, taj datum sam po sebi ne daje mnogo informacija o tome kako je datoteka mijenjana, tko ju je mijenjao i što je promijenjeno.

Kako bi se provjerilo je li korišten neki alat za uređivanje fotografije, potrebno je provjeriti polje Software. Originalna fotografija trebala bi u ovom polju imati program koji je stvorio fotografiju, npr. operacijski sustav uređaja na kojemu je uslikana. Ukoliko je fotografija mijenjana pomoću nekog od alata kao što su Adobe Photoshop, PhotoScape ili GIMP, polje Software imat će upisano njegovo ime. Sljedeća slika prikazuje metapodatke fotografije uređene pomoću alata Adobe Photoshop.

Slika 5: Otkrivanje softvera koji je zadnji mijenjao datoteku

Sa slike je također vidljivo kada je ta fotografija mijenjana (Modify Date) te da taj datum ne odgovara datumu nastanka (Create Date i Date/Time Original). Osim toga, veliki broj softvera za uređivanje slika obriše ili zaboravi izmijeniti sličicu thumbnail. Dakle, nedostatak te sličice ili nepodudaranje sa samom fotografijom direktni je pokazatelj na to da je fotografija izmijenjena pomoću softvera.

No, kako provjeriti jesu li sami metapodaci mijenjani? Netko tko je krivotvorio fotografiju mogao se pobrinuti za to da se iz metapodataka ne može doznati da je to učinio. Odnosno, mogao je direktno izmijeniti željena polja u metapodacima kako bi podržao svoju tvrdnju. Ukoliko je pri tome bio neoprezan, možda je kreirao neka nepodudaranja među podacima. Kada je fotografija snimljena, digitalna kamera zapisuje metapodatke poput marke i modela, razlučivosti, dimenzija slike i brzine zatvarača. Ukoliko su neki od metapodataka modificirani, moguće je pronaći nekonzistentnosti među tim značajkama. Primjerice, ako krivotvoritelj izmijeni uređaj koji je fotografija uslikana, ali zaboravi promijeniti broj piksela, jednostavno je dokazati da metapodaci ove slike nisu izvorni.

Problem privatnosti

Metapodaci pružaju informacije o uređaju koji na kojemu je fotografija stvorena, vremenu i mjestu nastanka te podacima o njezinu autoru. Ti podaci su vrlo korisni pri pronalasku i organizaciji fotografija, ali mogu stvoriti potencijalne rizike za privatnost njihovih vlasnika.

Velik broj osoba redovno svoje fotografije objavljuje na društvene mreže, postavlja ih na online oglase ili ih pak međusobno razmjenjuje s drugim osobama. Sve ove platforme mogu biti laka meta za krađu podataka te napadačima pružiti velik broj osjetljivih informacija o autoru skrivenih među metapodacima. Ukoliko takve platforme automatski ne izbrišu metapodatke ili ih korisnici uklone prije objavljivanja slika, te su informacije javne i dostupne bilo kome. Uz dovoljan broj osobnih fotografija žrtve, bilo tko može analizom metapodataka zaključiti gdje vlasnik tih fotografija stanuje, radi ili s kim je povezan.

U sklopu ovog seminara ispitano je nekoliko online platformi, tj. kako oni rukuju metapodacima svojih korisnika. Društvene mreže poput Facebooka, Twittera i Instagrama brišu metapodatke prenesenih fotografija jer pri učitavanju kompresiraju sliku. Također, online platforme za prodaju sadržaja poput eBaya i Njuškala brišu metapodatke kako bi zaštitili svoje korisnike. S druge strane, društvene mreže Flickr i Tumblr metapodatke ostavljaju u originalnom formatu.

Što se tiče izravne razmjene fotografija s drugim osobama, ukoliko se one šalju preko emaila, primatelj će moći vidjeti sve njezine originalne metapodatke. Također, ako se fotografije prenose preko servisa za spremanje u oblaku poput Google Drivea i Dropboxa, metapodaci će isto ostati neobrisani. S druge strane, ukoliko se šalju putem neke aplikacije za razmjenu poruka poput WhatsAppa ili Messengera, u procesu kompresije bit će obrisani metapodaci.

Platforme koje ne brišu metapodatke fotografija obično pružaju korisnicima opciju da ih sakriju, ali mogu te metapodatke zasebno spremiti u svoju bazu podataka. To mogu koristiti za personalizirane reklame, preporuku sličnih korisnika i drugo. Zato je najbolje što korisnik može učiniti kako bi zaštitio svoje privatne informacije jest to da prije prijenosa bilo kojih fotografija obriše sve njihove metapodatke pomoću alata.

No, ukoliko metapodaci fotografije ostanu u svom originalnom stanju, to ima i nekih prednosti. Jedna od njih je zaštita autorskih prava fotografija.

Zaštita autorskih prava

Još jedan način primjene alata za čitanje i uređivanje EXIF metapodataka jest zaštita autorskih prava fotografija. Pomoću metapodataka, kreator sadržaja može ugraditi svoj kontakt i informacije o autorskim pravima u datoteku. Primjerice, za to se mogu koristiti polja kao što su Creator, Author, Creator Work URL, Copyright, Usage Terms i druga polja vezana uz informacije o kreatoru i njegovom kontaktu. Sljedeća slika prikazuje primjer takvih metapodataka fotografije.

Slika 6: Informacije o autoru

Kao što je u prethodnom poglavlju spomenuto, neke društvene mreže koje su uglavnom namijenjene za fotografe (npr. Flickr) ne brišu metapodatke pri prenošenju fotografija, pa time ostanu i podaci o zaštiti autorskih prava. Ukoliko se sačuvaju takvi podaci, jednostavno je provjeriti originalnog autora datoteke, tj. dokazati je li sadržaj ukraden.

Zaključak

Metapodaci se u digitalnom svijetu koriste u ogromnim količinama. Služe kao činjenice o podacima, opisuju njihovo značenje i kontekst te pružaju informacije o tome kako se podaci definiraju, strukturiraju i predstavljaju. Bez njih, računalna obrada podataka ne bi bila onakvom kakva je danas jer olakšavaju njihovu organizaciju, indeksiranje, otkrivanje, pristup, analizu i upotrebu. Velik se broj metapodataka stvara automatski, no neki se od njih prepuštaju korisnicima za unos.

Alati za njihovu ekstrakciju i uređivanje omogućuju pregled skrivenih metapodataka i otkrivanje korisnih informacija koje se ne mogu doznati iz samih podataka. Također, omogućuju i njihovo pisanje, izmjenu i skupnu obradu. Osim toga, pokazali su se kao vrlo korisni u forenzičkoj analizi jer mogu proučavanjem metapodataka datoteke pokazati je li ona mijenjana, kako i kada. No, iako metapodaci pružaju mnogo povoljnosti, korisnik uvijek treba biti oprezan da ne bi neželjeno podijelio previše osobnih informacijama skrivenih među njima.

Literatura

[1] MerlinOne, Types Of Metadata, 2020.

[2] Harvey, P., ExifTool Application Documentation, 2005.

[3] Harvey, P., ExifTool Command-Line Examples, 2005.

[4] Library and Information Science Network, Introduction to Metadata, 2018.

[5] Berryhill, J., What is Metadata?, 2019.

[6] Bert Moss, Metadata In Digital Forensics, 2012.

[7] Data Recovery, What is Meta Data?, 2020.

[8] Harvey, P., ExifTool GUI, 2007.

[9] Kaeurialias, AnalogExif, 2012.

[10] Glogorovic, K., Blomeier, N. and Bushnev, D., Exif Pilot, 2020.

[11] Logipole, Metadata++, 2019.