Visualizzatore di Spettrogrammi

Visualizza il tuo spettro audio

Visualizza il contenuto frequenziale completo di qualsiasi file audio nel tempo. FFT regolabile, palette di colori e intervallo dB. Come Spek, ma nel tuo browser.

Trascina qui il tuo file audioí
o clicca per selezionare
FLAC WAV AIFF MP3 AAC OGG M4A OPUS
Caricamento...

Domande Frequenti

Uno spettrogramma è una rappresentazione visiva di come cambiano le frequenze di un file audio nel tempo. Immaginalo come una mappa di calore del suono. L'asse orizzontale rappresenta il tempo (da sinistra a destra, dall'inizio alla fine del file). L'asse verticale rappresenta la frequenza (in basso = bassi, in alto = acuti). Il colore in ogni punto mostra quanto è forte quella frequenza in quel momento — i colori brillanti significano forte, gli scuri significano silenzioso o silenzio.
Le linee orizzontali brillanti indicano toni sostenuti a una frequenza specifica. Le colonne verticali brillanti indicano esplosioni improvvise di energia su tutte le frequenze (come un colpo di batteria o un clic). Una banda brillante nella parte inferiore che rimane costante è di solito il basso o la voce. Un taglio brusco dove il colore scompare bruscamente (es. niente sopra i 16 kHz) di solito indica un formato con perdita come MP3 — i file lossless tipicamente hanno contenuto fino alla frequenza di Nyquist. Il silenzio appare come aree scure o nere. Puoi fare zoom cliccando e trascinando sullo spettrogramma per ispezionare sezioni specifiche più da vicino.
FFT significa Fast Fourier Transform — è l'operazione matematica che scompone l'audio in frequenze individuali. La dimensione FFT controlla il bilanciamento tra dettaglio frequenziale e dettaglio temporale. Una FFT più grande (come 16384) offre informazioni di frequenza molto precise — puoi vedere chiaramente le singole note — ma la risoluzione temporale diventa sfocata. Una FFT più piccola (come 1024) offre una risoluzione temporale precisa — puoi vedere esattamente quando un suono inizia e finisce — ma le informazioni di frequenza sono meno dettagliate. 4096 è un buon valore predefinito che bilancia entrambi. Prova a cambiare tra le dimensioni per vedere la differenza.
dB (decibel) misura l'intensità di un suono. I controlli dell'intervallo dB determinano quali livelli di volume sono visibili nello spettrogramma. Il controllo Min stabilisce il "pavimento" — tutto ciò che è più silenzioso di questo valore appare in nero. Il controllo Max stabilisce il "soffitto" — tutto ciò che è più forte appare nel colore più brillante. Ridurre l'intervallo (es. -80 dB a 0 dB) aumenta il contrasto e rende visibili i dettagli più morbidi. Ampliare l'intervallo (es. -140 dB a 0 dB) mostra più del rumore di fondo. Se lo spettrogramma appare troppo scuro, alza il controllo Min. Se appare saturato, abbassalo.
SoX (predefinita) usa una palette calda che va dal nero al viola, rosso, arancione, giallo e bianco. È ispirata allo strumento audio SoX e offre un buon contrasto percettivo su tutto l'intervallo. Spectrum usa una palette arcobaleno classica — blu per il silenzio, passando per ciano, verde, giallo, fino al rosso per i suoni più forti. È simile a quella usata da molti strumenti scientifici. Mono è una scala di grigi semplice — nero per il silenzio, bianco per i suoni più forti. È pulita e facile da leggere, ma mostra meno dettaglio nel medio range. Scegli quella che rende più facile vedere i dettagli che ti interessano.
Una funzione di finestra viene applicata a ogni frammento di audio prima di eseguire la FFT. Controlla il bilanciamento tra precisione frequenziale e spectral leakage (dispersione indesiderata tra frequenze adiacenti). Hann (predefinita) è l'opzione più comune — offre un buon equilibrio e funziona bene per la maggior parte dell'audio. Hamming è simile a Hann ma con un po' meno leakage a scapito di lobi principali più larghi — utile quando hai bisogno di una separazione più pulita tra frequenze vicine. Blackman-Harris ha la migliore soppressione dei lobi laterali tra le tre — produce la separazione di frequenze più pulita con leakage minimo, ma ogni banda di frequenza appare leggermente più larga. Per la maggior parte della musica e l'uso generale, Hann è sufficiente. Prova Blackman-Harris se vuoi il massimo isolamento delle frequenze.
Lineare (predefinita) distribuisce tutte le frequenze in modo uniforme — 1 kHz occupa lo stesso spazio verticale di 10 kHz. È ciò che usano Spek e la maggior parte degli analizzatori spettrali. Offre una vista chiara del contenuto ad alta frequenza e facilita il rilevamento di tagli audio con perdita. Logaritmica dà più spazio alle frequenze basse, allineandosi con il modo in cui percepiamo il tono — il salto da 100 Hz a 200 Hz suona uguale al salto da 1000 Hz a 2000 Hz (entrambi sono un'ottava). Questo rende la scala logaritmica molto migliore per analizzare la musica, dato che la maggior parte del contenuto musicale (voce, basso, chitarre, batteria) vive sotto i 5 kHz. Usa Lineare per ispezionare lo spettro completo o rilevare tagli audio con perdita. Usa Logaritmica quando vuoi vedere il dettaglio musicale e la separazione delle note.
Nei file audio stereo, il selettore di canale permette di vedere lo spettrogramma del solo canale Sinistro, del solo canale Destro, o un Mix di entrambi (media). È utile per individuare differenze tra i canali — ad esempio, alcuni strumenti possono essere panneggiati su un lato, o un canale può contenere artefatti che l'altro non ha. Il selettore appare solo quando carichi un file stereo.
Clicca e trascina sullo spettrogramma per selezionare un'area rettangolare — la vista farà zoom in quella regione. Puoi fare zoom più volte per avvicinarti ulteriormente. Gli assi del tempo e della frequenza si aggiorneranno per mostrare l'intervallo ingrandito, e apparirà una barra di informazioni di zoom con l'intervallo esatto. Per tornare alla vista completa, fai doppio clic sullo spettrogramma o premi il pulsante Ripristina Zoom.
Sì. I formati con perdita come MP3 e AAC tagliano le frequenze alte per risparmiare spazio. Un MP3 a 128 kbps tipicamente non ha contenuto sopra i ~16 kHz. Un MP3 a 320 kbps taglia intorno ai 20 kHz. Vedrai una linea orizzontale netta dove il colore si ferma bruscamente — tutto ciò che sta sopra è nero. Al contrario, un vero file lossless (FLAC, WAV) tipicamente mostra contenuto fino alla frequenza di Nyquist (la metà del sample rate). Se qualcuno dice che un file è "hi-res" ma lo spettrogramma mostra un taglio a 16 kHz, è probabile che sia stato ricampionato da una fonte con perdita.
No. Tutta l'elaborazione — decodifica, analisi FFT e rendering — avviene completamente nel tuo browser usando la Web Audio API e JavaScript. I tuoi file audio non lasciano mai il tuo dispositivo e nessun dato viene inviato a nessun server. Puoi anche usare questo strumento offline una volta che la pagina è stata caricata.