Visualizzatore di Spettrogrammi

Visualiza tu spettro de audio

Ve el contenido frecuencial completo di qualsiasi file audio a lo largo del tiempo. FFT ajustable, paletas de color y rango dB. Como Spek, pero nel tuo browser.

Trascina qui il tuo file audioí
o clicca per selezionare
FLAC WAV AIFF MP3 AAC OGG M4A OPUS
Caricamento...

Domande Frequenti

Uno spettrogramma è una rappresentazione visiva di come cambiano le frequenze di un file audio nel tempo. Imagínalo como un mapa de calor del sonido. El eje horizontal representa el tiempo (de izquierda a derecha, desde el inicio hasta el final del file). El eje vertical representa la frequenza (abajo = graves, arriba = agudos). El color en cada punto muestra qué tan fuerte es esa frequenza en ese momento — los colores brillantes significan fuerte, los oscuros significan silencioso o en silencio.
Las líneas horizontales brillantes indican tonos sostenidos a una frequenza específica. Las columnas brillantes verticales indican explosiones repentinas de energía en todas las frequenze (como un golpe de batería o un clic). Una banda brillante en la parte inferior que se mantiene constante suele ser el bajo o la voz. Un corte brusco donde el color desaparece de forma abrupta (p. ej., nada por encima de 16 kHz) suele indicar un formato con perdita como MP3 — los file lossless típicamente tienen contenido hasta la frequenza de Nyquist. El silencio aparece como áreas oscuras o negras. Puedes hacer zoom haciendo clic y arrastrando sobre el spettrogramma para inspeccionar secciones específicas más de cerca.
FFT significa Fast Fourier Transform — è l'operazione matematica che scompone l'audio in frequenze individuali. El tamaño FFT controla el balance entre detalle frecuencial y detalle temporal. Un FFT más grande (como 16384) ofrece información de frequenza muy precisa — puedes ver notas individuales con claridad — pero la resolución temporal se vuelve borrosa. Un FFT más pequeño (como 1024) ofrece una resolución temporal precisa — puedes ver exactamente cuándo un sonido empieza y termina — pero la información de frequenza es menos detallada. 4096 es un buen valor predeterminado que equilibra ambos. Prueba cambiando entre tamaños para ver la diferencia.
dB (decibelios) mide la intensidad de un sonido. Los controles de rango dB determinan qué niveles de volumen son visibles en el spettrogramma. El control Mín establece el "piso" — todo lo que sea más silencioso que este valor aparece en negro. El control Máx establece el "techo" — todo lo más fuerte aparece en el color más brillante. Reducir el rango (p. ej., -80 dB a 0 dB) aumenta el contraste y hace visibles los detalles más suaves. Ampliar el rango (p. ej., -140 dB a 0 dB) muestra más del ruido de fondo. Si el spettrogramma se ve demasiado oscuro, viene caricato el control Mín. Si se ve saturado, bájalo.
SoX (predeterminada) usa una paleta cálida que va del negro al morado, rojo, naranja, amarillo y blanco. Está inspirada en la herramienta de audio SoX y ofrece buen contraste perceptual en todo el rango. Spectrum usa una paleta arcoíris clásica — azul para silencio, pasando por cian, verde, amarillo, hasta rojo para lo más fuerte. Es similar a la que usan muchas herramientas científicas. Mono es una escala de grises simple — negro para el silencio, blanco para lo más fuerte. Es limpia y fácil de leer, pero muestra menos detalle en el rango medio. Elige la que haga más fácil ver los detalles que te interesan.
Una función de ventana se aplica a cada fragmento de audio antes de ejecutar el FFT. Controla el balance entre precisión frecuencial y spectral leakage (difusión no deseada entre frequenze adyacentes). Hann (predeterminada) es la opción más común — ofrece un buen equilibrio y funciona bien para la mayoría del audio. Hamming es similar a Hann pero con un poco menos de leakage a costa de lóbulos principales más anchos — útil cuando necesitas una separación más limpia entre frequenze cercanas. Blackman-Harris tiene la mejor supresión de lóbulos laterales de las tres — produce la separación de frequenze más limpia con leakage mínimo, pero cada banda de frequenza aparece ligeramente más ancha. Para la mayoría de la música y el uso general, Hann es suficiente. Prueba Blackman-Harris si quieres el mayor aislamiento de frequenze.
Lineal (predeterminada) distribuye todas las frequenze de forma uniforme — 1 kHz ocupa el mismo espacio vertical que 10 kHz. Es lo que usan Spek y la mayoría de los analizadores espectrales. Ofrece una vista clara del contenido de alta frequenza y facilita detectar cortes de audio con perdita. Logarítmica da más espacio a las frequenze bajas, coincidiendo con cómo percibimos el tono — el salto de 100 Hz a 200 Hz suena igual que de 1000 Hz a 2000 Hz (ambos son una octava). Esto hace que la escala logarítmica sea mucho mejor para analizar música, ya que la mayor parte del contenido musical (voz, bajo, guitarras, batería) vive por debajo de 5 kHz. Usa Lineal para inspeccionar el spettro completo o detectar cortes de audio con perdita. Usa Logarítmica cuando quieras ver el detalle musical y la separación de notas.
En file audio estéreo, el selector de canal permite ver el spettrogramma del canal Izquierdo únicamente, del canal Derecho únicamente, o una Mezcla de ambos (promedio). Es útil para detectar diferencias entre canales — por ejemplo, algunos instrumentos pueden estar panoramizados a un lado, o un canal puede contener artefactos que el otro no tiene. El selector solo aparece cuando cargas un file estéreo.
Haz clic y arrastra sobre el spettrogramma para seleccionar un área rectangular — la vista hará zoom en esa región. Puedes hacer zoom varias veces para acercarte más. Los ejes de tiempo y frequenza se actualizarán para mostrar el rango ampliado, y aparecerá una barra de información de zoom con el rango exacto. Para volver a la vista completa, haz doble clic en el spettrogramma o pulsa el botón Restablecer Zoom.
Sí. Los formatos con perdita como MP3 y AAC recortan las frequenze altas para ahorrar espacio. Un MP3 a 128 kbps típicamente no tiene contenido por encima de ~16 kHz. Un MP3 a 320 kbps corta alrededor de los 20 kHz. Verás una línea horizontal nítida donde el color se detiene abruptamente — todo lo que está por encima es negro. En cambio, un file lossless genuino (FLAC, WAV) típicamente muestra contenido hasta la frequenza de Nyquist (la mitad del sample rate). Si alguien dice que un file es "hi-res" pero el spettrogramma muestra un corte a 16 kHz, es probable que haya sido remuestreado de una fuente con perdita.
No. Todo el procesamiento — decodificación, análisis FFT y renderizado — ocurre completamente nel tuo browser usando la Web Audio API y JavaScript. Tus file audio nunca abandonan il tuo dispositivo y no se envía ningún dato a ningún server. Incluso puedes usar esta herramienta sin conexión una vez que la página haya cargado.