スペクトログラムビューアー
オーディオのスペクトラムを可視化
任意のオーディオファイルの全周波数コンテンツを時間軸で確認できます。FFTサイズ、カラーパレット、dBレンジを自由に調整。Spekのようにブラウザで直接使えます。
オーディオファイルをここにドロップ
またはクリックしてファイルを選択
FLAC
WAV
AIFF
MP3
AAC
OGG
M4A
OPUS
よくある質問
スペクトログラムとは、オーディオファイルの周波数が時間とともにどのように変化するかを視覚的に表したものです。音のヒートマップのようなものです。横軸は時間(左から右へ、ファイルの始まりから終わりまで)を表します。縦軸は周波数(下=低い低音、上=高い高音)を表します。各ポイントの色はその瞬間にその周波数がどの程度大きいかを示し、明るい色は大きい音、暗い色は小さい音や無音を意味します。
横方向の明るい線は、特定の周波数で持続するトーンや音符を示します。縦方向の明るい列は、全周波数にわたるエネルギーの急激な爆発(ドラムヒットやクリックなど)を示します。下部の一定した明るい帯は通常、低音やボーカルです。鋭いカットオフ(例:16 kHz以上に何もない)はMP3などの非可逆フォーマットを示すことが多く、ロスレスファイルは通常ナイキスト周波数まで全域にコンテンツが存在します。無音は暗い/黒い領域として表示されます。スペクトログラム上でクリックしてドラッグすることで特定のセクションをズームインして詳しく調べることができます。
FFTは高速フーリエ変換(Fast Fourier Transform)の略で、オーディオを個々の周波数に分解する数学的処理です。FFT Sizeは周波数の詳細度と時間の詳細度のトレードオフを制御します。大きなFFTサイズ(16384など)は非常に精密な周波数情報を提供し、個々の音符を明確に確認できますが、時間分解能が低下します。小さなFFTサイズ(1024など)は時間分解能が上がり、音の開始と終了を正確に確認できますが、周波数情報は精度が下がります。4096は両方のバランスが取れた適切なデフォルト値です。
dB(デシベル)は音の大きさを測る単位です。dBレンジスライダーはスペクトログラムに表示されるラウドネスの範囲を制御します。最小スライダーは「フロア」を設定し、それより小さい音は黒く表示されます。最大スライダーは「シーリング」を設定し、それより大きい音は最も明るい色で表示されます。レンジを狭めると(例:-80 dBから0 dB)コントラストが増し、小さい音の詳細がより見やすくなります。スペクトログラムが暗すぎる場合は最小スライダーを上げてみてください。
SoX(デフォルト)は黒からパープル、赤、オレンジ、黄色、白へと続く暖かいパレットです。SoXオーディオツールにインスパイアされており、全体的に良好な知覚コントラストを提供します。Spectrumはクラシックなレインボーパレットで、静かな音は青、大きな音は赤で表示されます。多くの科学ツールで使われる表示形式に近いです。Monoはシンプルなグレースケールで、無音は黒、大きな音は白で表示されます。
窓関数はFFTを実行する前にオーディオの各チャンクに適用されます。周波数精度とスペクトルリーケージ(隣接周波数間の不要なぼやけ)のトレードオフを制御します。Hann(デフォルト)は最も一般的な選択肢で、バランスが良くほとんどのオーディオに適しています。HammingはHannに似ていますが、リーケージがわずかに少ない代わりにメインローブが広くなります。Blackman-Harrisはサイドローブ抑制が最も優れており、最も清潔な周波数分離を実現しますが、各周波数帯域がわずかに広く見えます。
リニア(デフォルト)はすべての周波数を均等に配置します。Spekやほとんどのスペクトラムアナライザーで使用されています。高周波数コンテンツを明確に表示し、非可逆フォーマットのカットオフを確認しやすくなります。対数スケールは低周波数により多くのスペースを与え、人間の音感に近い表示になります。100 Hzから200 Hzのジャンプは、1000 Hzから2000 Hzのジャンプと同じ1オクターブです。楽曲分析(ボーカル、低音、ギター、ドラムなどは5 kHz以下に多い)には対数スケールが適しています。
ステレオオーディオファイルの場合、チャンネルセレクターで左チャンネルのみ、右チャンネルのみ、または両方のミックス(平均)のスペクトログラムを表示できます。チャンネル間の違いを確認するのに便利で、例えば特定の楽器がどちらかにパンされているかや、片方のチャンネルにのみアーティファクトが存在するかなどを確認できます。セレクターはステレオファイルを読み込んだときのみ表示されます。
スペクトログラム上でクリックしてドラッグすると、長方形のエリアを選択してその範囲にズームインできます。複数回ズームインしてさらに詳細を確認できます。時間軸と周波数軸がズームされた範囲に更新され、正確な範囲を示すズーム情報バーが表示されます。全体表示に戻すには、スペクトログラムをダブルクリックするか「ズームをリセット」ボタンをクリックします。
はい。MP3やAACなどの非可逆フォーマットは、ファイルサイズを節約するために高周波数をカットします。128 kbpsのMP3は通常、約16 kHz以上のコンテンツがありません。320 kbpsのMP3は約20 kHzでカットオフされます。色が急に止まる鋭い水平線が見え、それより上はすべて黒になります。対して、本物のロスレスファイル(FLAC、WAV)は通常ナイキスト周波数まで全域にコンテンツが存在します。「ハイレゾ」と謳われているファイルのスペクトログラムで16 kHzの硬いカットオフが見える場合、非可逆ソースからアップサンプリングされた可能性が高いです。
いいえ。デコード、FFT解析、レンダリングなど、すべての処理はWeb Audio APIとJavaScriptを使用してブラウザ内で完全に行われます。オーディオファイルがデバイスから外に出ることはなく、サーバーにデータが送信されることもありません。ページを一度読み込めばオフラインでも使用できます。