Come leggere uno spettrogramma
Introduzione
Lo spettrogramma è la rappresentazione grafica di un suono, in pratica uno strumento visivo che ci aiuta a capire ció che stiamo ascoltando, proprio come un partitura musicale. Uno spettrogramma fornisce peró informazioni piú complete e precise dello spartito, perché si basa su effettive misurazioni del suono in funzione delle varibili. Vediamo come leggere uno spettrogramma.
Lo spettrogramma è uno strumento impiegato principalmente per analizzare la voce umana, dato che ognuno di noi possiede un?impronta vocale unica ma, oltre che da fonologi e dialettologi, viene utilizzato anche dagli scienziati, ad esempio per studiare le forme di comunicazione degli animali. Su un diagramma cartesiano la frequenza (?f?) viene rappresentata sull?asse verticale e viene misurata in Hertz (Hz), o cicli per secondo ed in kilohertz (kHz) o migliaia di cicli per secondo, mentre la dimensione temporale (?t?) viene rappresentata sull?asse orizzontale. Il grafico puó essere realizzato in differenti formati, nei quali frequenza ed ampiezza (quantitá di energia) del suono figurano come varianti della tonalitá del grigio o della colorazione.
Facciamo qualche esempio pratico partendo dagli studi effettuati dalla Cornell University di NY sui sistemi di comunicazione delle balene. Mentre il suono scorre nella clip audio, potete seguirne lo sviluppo sul grafico da sinistra a destra, ascoltando i 5 strilli della balena. Ciascuno inizia con un tono acuto e decade rapidamente, proprio come rappresentato dalle figure a forma di virgola sul grafico. Se ascoltate attentamente potete notare anche piccoli dettagli acustici: ad esempio il secondo richiamo decade immediatamente, senza la breve introduzione di livello degli altri 4 richiami. Soffermatevi ora sul richiamo a ?gemito? mostrato nel grafico 2 a lato. Dura molto piú a lungo degli strilli e si mantiene su una frequenza di livello piuttosto stabile, con una sola lieve ascesa nel mezzo.
L?immagine 3 mostra lo spettrogramma di uno Scricciolo pettobianco, un uccellino delle foreste tropicali del Centro America. Il suo canto contiene una vasta gamma di elementi sonori, che possiamo distinguere visivamente nel grafico. Eccovi i principali parametri chiave, necessari a leggerlo. 1. Larghezza di banda: metodo in origine usato per identificare i formanti su uno spettrogramma; oggi normalmente sostituito da una ?trasformata veloce di fourier? (FFT) e da una ?codifica mediante predizione lineare?. 2. Esplosione o burst: evento acustico causato dal violento rilascio di aria, tipico di una consonante occlusiva; sullo spettrogramma assomiglia ad un sottile barra verticale. 3. Frizione: flusso d?aria turbolento, indica la presenza di fricative o affricate; sullo spettrogramma appare come una zona scura, diffusa su una sezione di frequenza amplia.
Consigli
- Esistono svariati programmi, anche open source, in grado di generare uno spettrogramma attraverso una serie di interfacce grafiche piú o meno sofisticate.