Visor de Espectrograma
Visualiza tu espectro de audio
Ve el contenido frecuencial completo de cualquier archivo de audio a lo largo del tiempo. FFT ajustable, paletas de color y rango dB. Como Spek, pero en tu navegador.
Arrastra tu archivo de audio aquí
o haz clic para explorar
FLAC
WAV
AIFF
MP3
AAC
OGG
M4A
OPUS
Preguntas Frecuentes
Un espectrograma es una representación visual de cómo cambian las frecuencias de un archivo de audio a lo largo del tiempo. Imagínalo como un mapa de calor del sonido. El eje horizontal representa el tiempo (de izquierda a derecha, desde el inicio hasta el final del archivo). El eje vertical representa la frecuencia (abajo = graves, arriba = agudos). El color en cada punto muestra qué tan fuerte es esa frecuencia en ese momento — los colores brillantes significan fuerte, los oscuros significan silencioso o en silencio.
Las líneas horizontales brillantes indican tonos sostenidos a una frecuencia específica. Las columnas brillantes verticales indican explosiones repentinas de energía en todas las frecuencias (como un golpe de batería o un clic). Una banda brillante en la parte inferior que se mantiene constante suele ser el bajo o la voz. Un corte brusco donde el color desaparece de forma abrupta (p. ej., nada por encima de 16 kHz) suele indicar un formato con pérdida como MP3 — los archivos lossless típicamente tienen contenido hasta la frecuencia de Nyquist. El silencio aparece como áreas oscuras o negras. Puedes hacer zoom haciendo clic y arrastrando sobre el espectrograma para inspeccionar secciones específicas más de cerca.
FFT significa Fast Fourier Transform — es la operación matemática que descompone el audio en frecuencias individuales. El tamaño FFT controla el balance entre detalle frecuencial y detalle temporal. Un FFT más grande (como 16384) ofrece información de frecuencia muy precisa — puedes ver notas individuales con claridad — pero la resolución temporal se vuelve borrosa. Un FFT más pequeño (como 1024) ofrece una resolución temporal precisa — puedes ver exactamente cuándo un sonido empieza y termina — pero la información de frecuencia es menos detallada. 4096 es un buen valor predeterminado que equilibra ambos. Prueba cambiando entre tamaños para ver la diferencia.
dB (decibelios) mide la intensidad de un sonido. Los controles de rango dB determinan qué niveles de volumen son visibles en el espectrograma. El control Mín establece el "piso" — todo lo que sea más silencioso que este valor aparece en negro. El control Máx establece el "techo" — todo lo más fuerte aparece en el color más brillante. Reducir el rango (p. ej., -80 dB a 0 dB) aumenta el contraste y hace visibles los detalles más suaves. Ampliar el rango (p. ej., -140 dB a 0 dB) muestra más del ruido de fondo. Si el espectrograma se ve demasiado oscuro, sube el control Mín. Si se ve saturado, bájalo.
SoX (predeterminada) usa una paleta cálida que va del negro al morado, rojo, naranja, amarillo y blanco. Está inspirada en la herramienta de audio SoX y ofrece buen contraste perceptual en todo el rango. Spectrum usa una paleta arcoíris clásica — azul para silencio, pasando por cian, verde, amarillo, hasta rojo para lo más fuerte. Es similar a la que usan muchas herramientas científicas. Mono es una escala de grises simple — negro para el silencio, blanco para lo más fuerte. Es limpia y fácil de leer, pero muestra menos detalle en el rango medio. Elige la que haga más fácil ver los detalles que te interesan.
Una función de ventana se aplica a cada fragmento de audio antes de ejecutar el FFT. Controla el balance entre precisión frecuencial y spectral leakage (difusión no deseada entre frecuencias adyacentes). Hann (predeterminada) es la opción más común — ofrece un buen equilibrio y funciona bien para la mayoría del audio. Hamming es similar a Hann pero con un poco menos de leakage a costa de lóbulos principales más anchos — útil cuando necesitas una separación más limpia entre frecuencias cercanas. Blackman-Harris tiene la mejor supresión de lóbulos laterales de las tres — produce la separación de frecuencias más limpia con leakage mínimo, pero cada banda de frecuencia aparece ligeramente más ancha. Para la mayoría de la música y el uso general, Hann es suficiente. Prueba Blackman-Harris si quieres el mayor aislamiento de frecuencias.
Lineal (predeterminada) distribuye todas las frecuencias de forma uniforme — 1 kHz ocupa el mismo espacio vertical que 10 kHz. Es lo que usan Spek y la mayoría de los analizadores espectrales. Ofrece una vista clara del contenido de alta frecuencia y facilita detectar cortes de audio con pérdida. Logarítmica da más espacio a las frecuencias bajas, coincidiendo con cómo percibimos el tono — el salto de 100 Hz a 200 Hz suena igual que de 1000 Hz a 2000 Hz (ambos son una octava). Esto hace que la escala logarítmica sea mucho mejor para analizar música, ya que la mayor parte del contenido musical (voz, bajo, guitarras, batería) vive por debajo de 5 kHz. Usa Lineal para inspeccionar el espectro completo o detectar cortes de audio con pérdida. Usa Logarítmica cuando quieras ver el detalle musical y la separación de notas.
En archivos de audio estéreo, el selector de canal permite ver el espectrograma del canal Izquierdo únicamente, del canal Derecho únicamente, o una Mezcla de ambos (promedio). Es útil para detectar diferencias entre canales — por ejemplo, algunos instrumentos pueden estar panoramizados a un lado, o un canal puede contener artefactos que el otro no tiene. El selector solo aparece cuando cargas un archivo estéreo.
Haz clic y arrastra sobre el espectrograma para seleccionar un área rectangular — la vista hará zoom en esa región. Puedes hacer zoom varias veces para acercarte más. Los ejes de tiempo y frecuencia se actualizarán para mostrar el rango ampliado, y aparecerá una barra de información de zoom con el rango exacto. Para volver a la vista completa, haz doble clic en el espectrograma o pulsa el botón Restablecer Zoom.
Sí. Los formatos con pérdida como MP3 y AAC recortan las frecuencias altas para ahorrar espacio. Un MP3 a 128 kbps típicamente no tiene contenido por encima de ~16 kHz. Un MP3 a 320 kbps corta alrededor de los 20 kHz. Verás una línea horizontal nítida donde el color se detiene abruptamente — todo lo que está por encima es negro. En cambio, un archivo lossless genuino (FLAC, WAV) típicamente muestra contenido hasta la frecuencia de Nyquist (la mitad del sample rate). Si alguien dice que un archivo es "hi-res" pero el espectrograma muestra un corte a 16 kHz, es probable que haya sido remuestreado de una fuente con pérdida.
No. Todo el procesamiento — decodificación, análisis FFT y renderizado — ocurre completamente en tu navegador usando la Web Audio API y JavaScript. Tus archivos de audio nunca abandonan tu dispositivo y no se envía ningún dato a ningún servidor. Incluso puedes usar esta herramienta sin conexión una vez que la página haya cargado.