Просмотрщик спектрограмм

Визуализируйте ваш аудиоспектр

Просматривайте полное частотное содержимое любого аудиофайла во времени. Настраиваемый FFT, цветовые палитры и диапазон dB. Как Spek, но прямо в вашем браузере.

Перетащите аудиофайл сюда
или нажмите для выбора
FLAC WAV AIFF MP3 AAC OGG M4A OPUS
Загрузка...

Часто задаваемые вопросы

Спектрограмма — это визуальное представление того, как частоты в аудиофайле меняются во времени. Думайте о ней как о тепловой карте звука. Горизонтальная ось представляет время (слева направо, от начала до конца файла). Вертикальная ось представляет частоту (внизу = низкие басы, вверху = высокие верхи). Цвет в каждой точке показывает, насколько громка эта частота в данный момент — яркие цвета означают громко, тёмные — тихо или тишину.
Горизонтальные яркие линии указывают на устойчивые тоны или ноты на определённой частоте. Вертикальные яркие столбцы указывают на внезапные всплески энергии по всем частотам (например, удар барабана или щелчок). Яркая полоса внизу, которая остаётся стабильной, обычно соответствует басам или вокалу. Резкое отсечение, где все цвета внезапно прекращаются (например, ничего выше 16 kHz), обычно указывает на формат с потерями, такой как MP3 — lossless-файлы обычно содержат контент вплоть до частоты Найквиста. Тишина отображается как тёмные/чёрные области. Вы можете увеличить масштаб, нажав и перетащив на спектрограмме, чтобы более детально рассмотреть конкретные участки.
FFT расшифровывается как Fast Fourier Transform (быстрое преобразование Фурье) — это математика, которая разбивает звук на отдельные частоты. FFT Size контролирует компромисс между детализацией по частоте и по времени. Больший FFT size (например, 16384) даёт очень точную информацию о частотах — вы можете чётко видеть отдельные ноты — но временное разрешение становится размытым. Меньший FFT size (например, 1024) даёт чёткое временное разрешение — вы можете точно видеть, когда звук начинается и заканчивается — но частотная информация менее точна. 4096 — хорошее значение по умолчанию, которое балансирует оба параметра. Попробуйте переключаться между размерами, чтобы увидеть разницу.
dB (децибелы) измеряет, насколько громок звук. Ползунки диапазона dB контролируют, какие уровни громкости видны на спектрограмме. Ползунок Min устанавливает «пол» — всё, что тише этого значения, отображается чёрным. Ползунок Max устанавливает «потолок» — всё, что громче, отображается самым ярким цветом. Сужение диапазона (например, от -80 dB до 0 dB) увеличивает контраст и делает более тихие детали более заметными. Расширение диапазона (например, от -140 dB до 0 dB) показывает больше фонового шума. Если ваша спектрограмма выглядит слишком тёмной, попробуйте поднять ползунок Min. Если она выглядит размытой, попробуйте опустить его.
SoX (по умолчанию) использует тёплую палитру, которая идёт от чёрного через фиолетовый, красный, оранжевый, жёлтый к белому. Она вдохновлена аудиоинструментом SoX и даёт хороший перцептивный контраст по всему диапазону. Spectrum использует классическую радужную палитру — синий для тихого, через голубой, зелёный, жёлтый, до красного для громкого. Она похожа на ту, что используется во многих научных инструментах. Mono — это простая шкала серого: чёрный для тишины, белый для громкого. Она чистая и легко читается, но показывает меньше деталей в среднем диапазоне. Выберите ту, которая делает интересующие вас особенности легче для просмотра.
Оконная функция применяется к каждому фрагменту аудио перед запуском FFT. Она контролирует компромисс между частотной точностью и спектральной утечкой (нежелательным размытием между соседними частотами). Hann (по умолчанию) — наиболее распространённый выбор: он обеспечивает хороший баланс и хорошо работает для большинства аудио. Hamming похож на Hann, но имеет немного меньшую утечку за счёт более широких главных лепестков — полезен, когда вам нужно более чёткое разделение между близкими частотами. Blackman-Harris имеет наилучшее подавление боковых лепестков из трёх — он производит самое чистое разделение частот с минимальной утечкой, но каждая частотная полоса выглядит немного шире. Для большинства музыки и общего использования Hann подходит идеально. Попробуйте Blackman-Harris, если хотите наиболее чёткой частотной изоляции.
Линейная (по умолчанию) распределяет все частоты равномерно — 1 kHz занимает столько же вертикального пространства, сколько 10 kHz. Это то, что используют Spek и большинство анализаторов спектра. Она даёт чёткий обзор высокочастотного контента и облегчает обнаружение отсечений из-за сжатия с потерями. Логарифмическая даёт больше места для низких частот, что соответствует тому, как мы на самом деле воспринимаем высоту тона — переход от 100 Hz к 200 Hz звучит так же, как от 1000 Hz к 2000 Hz (оба — одна октава). Это делает логарифмическую шкалу намного лучше для анализа музыки, поскольку большая часть музыкального контента (вокал, бас, гитары, ударные) находится ниже 5 kHz. Используйте линейную для проверки полного спектра или поиска отсечений. Используйте логарифмическую, когда хотите видеть музыкальные детали и разделение нот.
Для стерео-аудиофайлов селектор канала позволяет просматривать спектрограмму только левого канала, только правого канала или микса обоих (среднее). Это полезно для выявления различий между каналами — например, некоторые инструменты могут быть запанорамированы в одну сторону, или один канал может содержать артефакты, которых нет в другом. Селектор появляется только при загрузке стерео-файла.
Нажмите и перетащите на спектрограмме, чтобы выбрать прямоугольную область — вид увеличится до этой области. Вы можете увеличивать масштаб несколько раз, чтобы приблизиться больше. Оси времени и частоты обновятся, чтобы показать увеличенный диапазон, и появится панель информации о масштабе с точным диапазоном. Чтобы вернуться к полному виду, либо дважды нажмите на спектрограмме, либо нажмите кнопку Сбросить масштаб.
Да. Форматы с потерями, такие как MP3 и AAC, обрезают высокие частоты для экономии места. MP3 128 kbps обычно не содержит контента выше ~16 kHz. MP3 320 kbps обрезается около 20 kHz. Вы увидите чёткую горизонтальную линию, где все цвета резко прекращаются — всё выше чёрное. Напротив, настоящий lossless-файл (FLAC, WAV) обычно показывает контент вплоть до частоты Найквиста (половина частоты дискретизации). Если кто-то утверждает, что файл «hi-res», но спектрограмма показывает резкое отсечение на 16 kHz, он, вероятно, был передискретизирован из источника с потерями.
Нет. Вся обработка — декодирование, FFT-анализ и рендеринг — происходит полностью в вашем браузере с использованием Web Audio API и JavaScript. Ваши аудиофайлы никогда не покидают ваше устройство, и никакие данные не отправляются на сервер. Вы даже можете использовать этот инструмент офлайн после загрузки страницы.