400 likes | 588 Views
Tesi di Laurea - Aprile 2005. Strumenti automatici di elaborazione del segnale audio per sistemi di riversamento massivo di materiale radiofonico. Candidato: Tommaso DEPALMA. Relatore: Prof. Angelo Raffaele MEO Co-relatori: Dott. Daniele AIROLA - RAI CRIT
E N D
Tesi di Laurea - Aprile 2005 Strumenti automatici di elaborazione del segnale audio per sistemi di riversamento massivo di materiale radiofonico Candidato: Tommaso DEPALMA Relatore: Prof. Angelo Raffaele MEO Co-relatori: Dott. Daniele AIROLA - RAI CRIT Ing. Giorgio DIMINO - RAI CRIT Prof. Juan Carlos DE MARTIN
Politecnico di Torino Argomenti presentati • Sviluppo della tesi • parte teorica • parte sperimentale • Il processo di riversamento massivo • Ambiente di sviluppo e test • Selezione dei parametri audio e sviluppo degli strumenti di analisi • Valutazione della qualità dei riversamenti • casi particolari • situazioni anomale Aprile 2005
Politecnico di Torino Sviluppo della Tesi Obiettivo:fornire strumenti automatici di elaborazione del segnale audio per sistemi di riversamento massivo di materiale radiofonico. Parte teorica: • Studio delle problematiche presenti nella digitalizzazione di un archivio considerando: • i supporti di registrazione (nastri magnetici, dischi in vinile) e le loro caratteristiche • i limiti intrinseci che caratterizzano il segnale audio memorizzato sui supporti • i problemi relativi alla fase di riproduzione • le tecnologie necessarie ed i dispositivi utilizzati nella catena • le tarature dei dispositivi utilizzati • file format adeguati alle esigenze del mondo professionale (ambito broadcasting) in termini di qualità ed interoperabilità tra differenti sistemi/ambienti Il tutto al fine di ottenere una catena di riproduzione e digitalizzazione allo stato dell’arte. Aprile 2005
Politecnico di Torino Sviluppo della Tesi Obiettivo:fornire strumenti automatici di elaborazione del segnale audio per sistemi di riversamento massivo di materiale radiofonico. Parte teorica: • Selezione di parametri rappresentativi del segnale audio che consentano il monitoraggio di ogni singolo processo di riversamento • Metodi di calcolo utilizzati per l’estrazione dei parametri dal file audio prodotto dal processo di digitalizzazione. Aprile 2005
Politecnico di Torino Sviluppo della Tesi Obiettivo:fornire strumenti automatici di elaborazione del segnale audio per sistemi di riversamento massivo di materiale radiofonico. • Sviluppo di strumenti software necessari all’elaborazione automatica del materiale audio radiofonico digitalizzato dalla nastroteca RAI – Torino • adeguati alle caratteristiche (24bit@48kHz) ed al formato file (Broadcast Wave Format - BWF) prodotto dal riversamento • appropriati all’infrastruttura hardware/software attualmente utilizzata in RAI • in grado di monitorare la qualità di ciascun riversamento tramite misure, file di dati e grafici relativi, in modo da agevolare la fase di certificazione manuale (che può richiedere eventuali ripetizioni del processo di digitalizzazione) • in grado di evidenziare eventuali problematiche riguardanti i supporti e i dispositivi utilizzati nella catena • che consentano l’individuazione su base temporale di fenomeni di degradamento o deriva altrimenti difficilmente identificabili Parte sperimentale: Aprile 2005
Politecnico di Torino Il processo di riversamento massivo Da dove nasce l’esigenza di un processo massivo di riversamento e digitalizzazione? • L’invecchiamento e il conseguente degrado dei supporti analogici è inevitabile • Data l’enorme quantità di supporti presenti negli archivi • Il processo di riversamento tra supporti analogici comporta sempre una perdita di informazione che la digitalizzazione consente di evitare • Disponibilità ridotta e costi di manutenzione elevata degli apparati necessari alla riproduzione di supporti analogici • L’applicazione di strumenti e tecnologie informatiche che consentano sia l’utilizzo di processi e strumenti più efficienti che la creazione di nuovi modelli di business Aprile 2005
Politecnico di Torino Aprile 2005
Segnale audio analogico Segnale audio numerico Flusso file audio Flusso file analisi Tape drive Tape drive Tape drive Tape drive Tape drive Tape drive Tape drive Tape drive Minicomputer Minicomputer Politecnico di Torino Stazione di digitalizzazione A/D Strumenti sw di analisi automatica Aprile 2005
Politecnico di Torino Ambiente di sviluppo e test Per lo sviluppo e la verifica degli strumenti di analisi sono state esaminate oltre 600 sessioni di digitalizzazione. Ogni sessione rappresenta il contenuto di un nastro ed ha una durata temporale che può variare da poco più di cinque minuti ad un’ora e mezza, con una media di circa mezz’ora per file. Aprile 2005
Politecnico di Torino Ambiente di sviluppo e test Piattaforma di sviluppo e analisi Sistema operativo: Unix (Linux) Performance: 4x (1h di materiale viene analizzata in 15') su biprocessore Intel@1GHz Aprile 2005
Politecnico di Torino Elenco parametri audio analizzati e relativo utilizzo Misure Obiettivi Livello di Picco - errata taratura apparati (livelli di acquisizione) RMS - anomalie apparati della catena di digitalizzazione DC Offset - segnalare anomalie nel contenuto del nastro ___________________________________________________________________________ Percentuale di silenzio - identificazione di anomalie (drop out) - fornire una segmentazione temporale (verifiche con documentazione associata) - efficienza (produttività) del processo di digitalizzazione ___________________________________________________________________________ Dinamica analogica - taratura degli apparati SNR - stato manutenzione degli apparati Azimuth Larghezza di banda Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi Livello di Picco Rappresenta la misura del massimo livello in valore assoluto raggiunto dal segnale nel tempo. Conoscere il livello di picco è necessario per monitorare il corretto utilizzo della gamma dinamica digitale del convertitore A/D ed evidenziare eventuali fenomeni di prossimità o raggiungimento del massimo livello in ingresso al convertitore A/D ( 2 n_bits_sample-1-1, o 0 dB, o 100 %) per un breve tratto di tempo, indice di un elevato livello di registrazione nell’acquisizione. Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi RMS Il livello RMS (Root Mean Square) esprime il valore efficace del segnale. Senza ricorrere a complesse valutazioni psicoacustiche è un indicatore (medio) dell’energia del suono, se calcolata su un piccolo intervallo di tempo, o l’indice del livello di volume globale di un intero brano. Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi DC Offset Direct Current Offsetè la misura della componente continua del segnale analizzato che indica lo spostamento medio dell’onda rispetto all’asse (rispetto quindi al valor 0, o -∞ dB). Tale componente continua può essere solamente indotta dagli apparati elettronici presenti nella catena di digitalizzazione. Il DC Offset quindi è un indicatore della possibile comparsa di un malfunzionamento. Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi Soglia del silenzio Silenzio: in assenza di segnaleutile si è in presenza di rumore introdotto dagli apparati elettronici impiegati durante l’acquisizione (dal giradischi, magnetofono al convertitore analogico/digitale il cui livello RMS dovrebbe tipicamente essere inferiore a -60 dB) a cui si somma il rumore di fondodel supporto (provocato dall’attrito tra la testina di lettura e il nastro o da polvere atmosferica, particelle elettrostatiche, particelle di fumo, impronte digitali o degrado dei dischi) Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi Calcolo soglia del silenzio (1° metodo) La soglia del silenzio è calcolata statisticamente in modo che la probabilità dell’energia del segnale utile (non-silenzio) sia del 95%. Calcolato lo scarto quadratico medio (o deviazione standard) dei diversi valori in dB dell’energia con la formula: la soglia del silenzio è calcolata con la formula: threshold = RMS (dB) – 1,95 ∙ σ dove il fattore 1,95 è il valore corrispondente al 95% della probabilità (cioè l’area compresa tra l’asse delle ascisse da –1,95σ a +1,95σ e la curva normale standard centrata in 0 è 0,95) Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi Calcolo soglia del silenzio (2° metodo) Silenzio: porzione di segnale audio non percepibile dall’orecchio umano. SW = EW ZCRW EW: STE (Short Time Energy) di una finestra temporale “W” di 10ms ZCRW: Zero Crossing Rate – Numero di attraversamenti per lo zero L’utilizzo combinato delle misure di STE e ZCR consente una più accurata individuazione di porzioni di silenzio Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi Segmentazione Si è scelto di fornire una segmentazione “cruda”, cioè senza imporre un minimo temporale alla segmentazione del silenzio, in quanto potrebbe essere utile, ad esempio, nel caso si vogliano tracciare eventi di dropout del nastro; ovviamente tale ricerca potrebbe “annegare” tra le pause musicali o le pause presenti in un parlato. Questa scelta non influisce molto sul valore della percentuale di silenzio calcolata, in quanto queste particolari segmentazioni di silenzio rilevate occupano brevissimi intervalli temporali. Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi Percentuale di silenzio Lo scopo del calcolo della percentuale di silenzio è rivelare: - per acquisizioni da nastro: • ha considerevoli parti vuote; • ha subito una degradazione del legante allungamento del nastro perdita del segnale; • ha subito una diminuzione nel tempo della magnetic remanence delle particelle abbassamento del livello di uscita del segnale perdita delle informazioni in esso contenute; • i dipoli del supporto magnetico sono caratterizzati da una bassa coercitivity è possibile che si sia smagnetizzatoperdita del segnale; • l’acquisizione è continuata, nonostante il nastro sia terminato. - per acquisizioni da dischi: • cartuccia o puntina del giradischi non montata in modo corretto; • l’acquisizione è continuata, nonostante la puntina abbia raggiunto il solco di parcheggio. Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Aprile 2005
GAMMA DINAMICAdB TIPO DI NASTRO N° TRACCE VELOCITÀ IPS cm/s 1/4 2 30 76,2 66 1/4 2 15 38,1 60 1/4 2 7,5 19 54 1/4 2 3,75 9,53 48 1/4 2 1+7/8 4,76 42 36 1/4 2 15/16 2,38 Politecnico di Torino Parametri audio e strumenti di analisi SNR e Gamma dinamica analogica Il rapporto segnale rumore (SNR) e la gamma dinamica analogica sono due tipici parametri che misurano la bontà di un supporto audio analogico. SNR: calcolato come differenza tra l’energia del non-silenzio e del silenzio (dB). Gamma dinamica analogica: differenza tra il picco dell’energia del segnale e l’energia del silenzio (dB). Nastri: la gamma dinamica che può essere incisa su di essi è legata essenzialmente anche alla velocità di trascinamento del nastro. Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi Larghezza di banda Anche la larghezza di banda è un parametro che caratterizza la qualità del segnale registrato su di un supporto. Per stabilire la larghezza di banda massima in un nastro, si devono considerare la velocità di trascinamento e le dimensioni del traferrodella testina di lettura. v = velocità trascinamento L = larghezza traferro della testina F = massima frequenza registrabile Già alla velocità di 7,5 ips (19 cm/s), con un traferro di 9,5 µm, si ottiene una banda estesa fino ai 20 kHz. Per ottenere la larghezza di banda si è calcolato la misura dell’intervallo di frequenze in cui è contenuta il 99,68% dell’energia del segnale. Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Parametri audio e strumenti di analisi Azimuth Importante parametro indice dell’allineamento tra le testine del lettore rispetto alle tracce incise sul supporto magnetico. Il disallineamento delle testine di un magnetofono comporta un fenomeno di interferenza tra il contenuto delle tracce registrate sul supporto. Tale l’interferenza consiste in una contributo additivo temporalmente ritardato il cui effetto si manifesta inoltre in una riduzione della banda del segnale. Il calcolo dell’azimuth si basa sul calcolo di questo sfasamento. Come unità di misura dell’azimuth si utilizzano i gradi che si riferiscono allo sfasamento tra il canale sinistro e il canale destro di un segnale di test composto da un tono puro a 10 kHz (azimuth @10khz). Aprile 2005
Politecnico di Torino Aprile 2005
Politecnico di Torino Conclusioni Lo sviluppo di strumenti di analisi automatica del segnale audio ha dimostrato potenzialità ed efficacia nell'individuazione di problematiche (sia puntuali che generali) che si possono presentare in un processo di riversamento massivo. Possibili sviluppi futuri Integrazione con la piattaforma di acquisizione: • sviluppo di interfacce che agevolino l'accesso e il monitoraggio all'analisi delle singole acquisizioni • sviluppo di modelli statistici che, individuando situazioni e trend anomali, forniscano al controllo di qualità un affidabile e sintetico strumento di decisione Aprile 2005
Politecnico di Torino FINE Aprile 2005
Politecnico di Torino Aprile 2005