La Multimedia Forensics (MF) include un insieme di metodologie scientifiche recentemente proposte per l’analisi di segnali multimediali (audio, immagini, video) al fine di recuperare da essi evidenze probatorie; in particolare, tali tecnologie intendono rivelare la storia dei contenuti digitali:
- identificando il dispositivo di acquisizione che ha prodotto i dati;
- validando l’autenticità dei contenuti;
- estraendo informazioni dai segnali multimediali.
Il termine “forensic” (forense) deriva direttamente dall’ambito legale, in cui oggi l’interpretazione tradizionale delle testimonianze sta cambiando e la maggior parte dei procuratori, avvocati e giudici hanno a che fare con prove digitali, ovvero tutte quelle forme di prove create, manipolate, conservate, trasmesse per mezzo di dispositivi digitali (computer, sistemi di telefonia, sistemi di comunicazioni wireless, internet, cellulari, smart card, sistemi di navigazione, e molti altri). Mentre la Computer Forensics considera l’uso di metodi scientifici per estrarre i dati digitali dai dispositivi coinvolti in scenari criminosi, la Multimedia Forensics, in una seconda fase, applica metodi scientifici per l’analisi di questi contenuti.
L’approccio generale della MF si basa sull’idea che delle tracce intrinseche (una sorta di impronte digitali) rimangono nel contenuto digitale, sia durante il processo di creazione che durante ogni altra elaborazione successiva; quindi, estraendo queste impronte dai dati e analizzando le loro proprietà, è possibile acquisire una qualche conoscenza sulla storia che i dati stessi hanno avuto nel loro ciclo di vita.
Per l’identificazione della sorgente, gli algoritmi di MF assumono che il dispositivo di acquisizione lascia delle tracce dovute alle sue caratteristiche specifiche, ad esempio il rumore dei sensori, la distorsione delle lenti, etc.. Basandosi su tali caratteristiche, i test statistici sono in grado di distinguere tra contenuti visuali generati da algoritmi di computer grafica piuttosto che provenienti da fotocamere, oppure immagini provenienti da scanner; inoltre possono distinguere modelli differenti di fotocamere o addirittura tra specifici dispositivi anche se della stessa marca e modello.
Analogamente, gli algoritmi per la rivelazione di manipolazioni tentano di verificare l’autenticità del contenuto, assumendo che differenti algoritmi di elaborazione lasciano tracce identificabili (ad esempio gli artefatti della compressione JPEG); o che le tracce introdotte dal dispositivo di acquisizione vengono alterate durante la contraffazione; o che qualche caratteristica della scena presenta delle inconsistenze a causa della manipolazione (ad esempio inconsistenze sulle condizioni di illuminazione o sulla prospettiva relativamente ad elementi inseriti successivamente nella scena).
Infine, la Multimedia Forensics considera di sfruttare delle procedure per il miglioramento del segnale (come la soppressione del rumore) al fine di ottenere un più alto grado di intelligibilità dei dati. Inoltre, applica delle tecniche di recupero delle informazioni ai segnali multimediali, per acquisire informazioni dai dati visuali e audio, come l’analisi dei colori, il riconoscimenti di pattern, misure fotogrammetriche di oggetti nella scena (ad esempio impronte), valutazione di caratteristiche biometriche di persone nella scena (ad esempio l’altezza).