Spektrogramm-Viewer
Visualisieren Sie Ihr Audiospektrum
Sehen Sie den vollständigen Frequenzinhalt jeder Audiodatei über die Zeit. Einstellbare FFT-Größe, Farbpaletten und dB-Bereich. Wie Spek, aber direkt in Ihrem Browser.
Audiodatei hier ablegen
oder klicken zum Durchsuchen
FLAC
WAV
AIFF
MP3
AAC
OGG
M4A
OPUS
Häufig gestellte Fragen
Ein Spektrogramm ist eine visuelle Darstellung, wie sich die Frequenzen einer Audiodatei im Laufe der Zeit verändern. Stellen Sie es sich wie eine Heatmap für Klang vor. Die horizontale Achse repräsentiert die Zeit (von links nach rechts, vom Anfang bis zum Ende der Datei). Die vertikale Achse repräsentiert die Frequenz (unten = tiefe Bässe, oben = hohe Höhen). Die Farbe an jedem Punkt zeigt, wie laut diese Frequenz zu diesem Zeitpunkt ist — helle Farben bedeuten laut, dunkel bedeutet leise oder still.
Horizontale helle Linien zeigen anhaltende Töne bei einer bestimmten Frequenz an. Vertikale helle Spalten zeigen plötzliche Energieausbrüche über alle Frequenzen hinweg an (wie ein Schlagzeugschlag oder ein Klick). Ein helles Band am unteren Rand, das konstant bleibt, sind meist Bässe oder Gesang. Ein scharfer Abschnitt, wo alle Farben abrupt enden (z.B. nichts oberhalb von 16 kHz), weist normalerweise auf ein verlustbehaftetes Format wie MP3 hin — verlustlose Dateien haben typischerweise Inhalt bis zur Nyquist-Frequenz. Stille erscheint als dunkle/schwarze Bereiche. Sie können hineinzoomen, indem Sie auf das Spektrogramm klicken und ziehen, um bestimmte Abschnitte genauer zu untersuchen.
FFT steht für Fast Fourier Transform — das ist die Mathematik, die Audio in einzelne Frequenzen zerlegt. Die FFT-Größe steuert den Kompromiss zwischen Frequenzdetail und Zeitdetail. Eine größere FFT-Größe (wie 16384) liefert sehr präzise Frequenzinformationen — Sie können einzelne Noten deutlich erkennen — aber die zeitliche Auflösung wird unscharf. Eine kleinere FFT-Größe (wie 1024) liefert präzise Zeitauflösung — Sie können genau sehen, wann ein Klang beginnt und endet — aber die Frequenzinformationen sind weniger präzise. 4096 ist ein guter Standardwert, der beides ausbalanciert. Probieren Sie verschiedene Größen aus, um den Unterschied zu sehen.
dB (Dezibel) misst, wie laut ein Klang ist. Die dB-Bereich-Regler steuern, welche Lautstärkepegel im Spektrogramm sichtbar sind. Der Min-Regler setzt den „Boden" — alles, was leiser als dieser Wert ist, erscheint schwarz. Der Max-Regler setzt die „Decke" — alles Lautere erscheint in der hellsten Farbe. Den Bereich einengen (z.B. -80 dB bis 0 dB) erhöht den Kontrast und macht leisere Details sichtbarer. Den Bereich erweitern (z.B. -140 dB bis 0 dB) zeigt mehr vom Grundrauschen. Wenn Ihr Spektrogramm zu dunkel aussieht, erhöhen Sie den Min-Regler. Wenn es übersteuert wirkt, senken Sie ihn.
SoX (Standard) verwendet eine warme Palette, die von Schwarz über Lila, Rot, Orange, Gelb bis Weiß reicht. Sie ist vom SoX-Audio-Tool inspiriert und bietet guten Wahrnehmungskontrast über den gesamten Bereich. Spectrum verwendet eine klassische Regenbogenpalette — Blau für leise, über Cyan, Grün, Gelb bis Rot für laut. Sie ähnelt dem, was viele wissenschaftliche Tools verwenden. Mono ist eine einfache Graustufen-Palette — Schwarz für Stille, Weiß für laut. Sie ist übersichtlich und leicht zu lesen, zeigt aber weniger Detail im mittleren Bereich. Wählen Sie diejenige, die die für Sie wichtigen Merkmale am deutlichsten sichtbar macht.
Eine Fensterfunktion wird auf jeden Audioabschnitt angewendet, bevor der FFT ausgeführt wird. Sie steuert den Kompromiss zwischen Frequenzpräzision und Spectral Leakage (unerwünschte Verwischung zwischen benachbarten Frequenzen). Hann (Standard) ist die häufigste Wahl — sie bietet ein gutes Gleichgewicht und funktioniert gut für die meisten Audiodateien. Hamming ist ähnlich wie Hann, hat aber etwas weniger Leakage auf Kosten breiterer Hauptkeulen — nützlich, wenn Sie eine sauberere Trennung zwischen nahe beieinander liegenden Frequenzen benötigen. Blackman-Harris hat die beste Nebenkeulenunterdrückung aller drei — sie erzeugt die sauberste Frequenztrennung mit minimalem Leakage, aber jedes Frequenzband erscheint etwas breiter. Für die meisten Musik- und Allgemeinanwendungen ist Hann ausreichend. Probieren Sie Blackman-Harris, wenn Sie die schärfste Frequenzisolierung wünschen.
Linear (Standard) verteilt alle Frequenzen gleichmäßig — 1 kHz erhält den gleichen vertikalen Platz wie 10 kHz. Das verwenden Spek und die meisten Spektrumanalysatoren. Es bietet eine klare Ansicht des Hochfrequenzinhalts und erleichtert das Erkennen von Verlust-Abschnitten. Logarithmisch gibt tieferen Frequenzen mehr Platz, entsprechend unserer tatsächlichen Tonwahrnehmung — der Sprung von 100 Hz auf 200 Hz klingt genauso wie von 1000 Hz auf 2000 Hz (beide sind eine Oktave). Das macht die logarithmische Skala viel besser für die Analyse von Musik, da die meisten musikalischen Inhalte (Gesang, Bass, Gitarren, Schlagzeug) unterhalb von 5 kHz liegen. Verwenden Sie Linear, um das gesamte Spektrum zu untersuchen oder Verlust-Abschnitte zu erkennen. Verwenden Sie Logarithmisch, wenn Sie musikalische Details und Notentrennung sehen möchten.
Bei Stereo-Audiodateien ermöglicht der Kanalwähler die Anzeige des Spektrogramms nur des linken Kanals, nur des rechten Kanals oder einer Mischung beider (Durchschnitt). Dies ist nützlich, um Unterschiede zwischen Kanälen zu erkennen — zum Beispiel können einige Instrumente auf eine Seite gepannt sein, oder ein Kanal kann Artefakte enthalten, die der andere nicht hat. Der Wähler erscheint nur, wenn Sie eine Stereo-Datei laden.
Klicken und ziehen Sie auf dem Spektrogramm, um einen rechteckigen Bereich auszuwählen — die Ansicht zoomt in diesen Bereich hinein. Sie können mehrmals zoomen, um näher heranzukommen. Die Zeit- und Frequenzachsen werden aktualisiert, um den vergrößerten Bereich anzuzeigen, und eine Zoom-Informationsleiste mit dem genauen Bereich erscheint. Um zur vollständigen Ansicht zurückzukehren, doppelklicken Sie auf das Spektrogramm oder klicken Sie auf die Schaltfläche Zoom zurücksetzen.
Ja. Verlustbehaftete Formate wie MP3 und AAC schneiden hohe Frequenzen ab, um Speicherplatz zu sparen. Ein 128 kbps MP3 hat typischerweise keinen Inhalt oberhalb von ~16 kHz. Ein 320 kbps MP3 schneidet bei etwa 20 kHz ab. Sie sehen eine scharfe horizontale Linie, wo alle Farben abrupt enden — alles darüber ist schwarz. Im Gegensatz dazu zeigt eine echte verlustlose Datei (FLAC, WAV) typischerweise Inhalt bis zur Nyquist-Frequenz (die Hälfte der sample rate). Wenn jemand behauptet, eine Datei sei „hi-res", das Spektrogramm aber einen harten Abschnitt bei 16 kHz zeigt, wurde sie wahrscheinlich von einer verlustbehafteten Quelle hochgesampelt.
Nein. Die gesamte Verarbeitung — Dekodierung, FFT-Analyse und Rendering — findet vollständig in Ihrem Browser mithilfe der Web Audio API und JavaScript statt. Ihre Audiodateien verlassen niemals Ihr Gerät und es werden keine Daten an einen Server gesendet. Sie können dieses Tool sogar offline verwenden, sobald die Seite geladen wurde.