Spectrogramme

Visualisez votre spectre audio

Observez le contenu fréquentiel complet de n'importe quel fichier audio dans le temps. Taille FFT, palettes de couleurs et plage dB ajustables. Comme Spek, mais directement dans votre navigateur.

Déposez votre fichier audio ici
ou cliquez pour parcourir
FLAC WAV AIFF MP3 AAC OGG M4A OPUS
Chargement...

Foire aux questions

Un spectrogramme est une représentation visuelle de l'évolution des fréquences d'un fichier audio dans le temps. Imaginez-le comme une carte de chaleur du son. L'axe horizontal représente le temps (de gauche à droite, du début à la fin du fichier). L'axe vertical représente la fréquence (en bas = graves, en haut = aigus). La couleur à chaque point indique l'intensité de cette fréquence à cet instant — les couleurs vives signifient fort, les couleurs sombres signifient faible ou silencieux.
Les lignes horizontales lumineuses indiquent des tonalités ou notes soutenues à une fréquence précise. Les colonnes verticales lumineuses indiquent des pics d'énergie soudains sur toutes les fréquences (comme un coup de batterie ou un clic). Une bande lumineuse en bas qui reste constante correspond généralement aux basses ou aux voix. Une coupure nette où toute couleur s'arrête brusquement (par exemple, rien au-dessus de 16 kHz) indique généralement un format avec perte comme MP3 — les fichiers sans perte ont typiquement du contenu jusqu'à la fréquence de Nyquist. Le silence apparaît comme des zones sombres ou noires. Vous pouvez zoomer en cliquant-glissant sur le spectrogramme pour inspecter des sections spécifiques de plus près.
FFT signifie Transformée de Fourier Rapide — c'est le calcul qui décompose l'audio en fréquences individuelles. La taille FFT contrôle le compromis entre la précision fréquentielle et la précision temporelle. Une taille FFT plus grande (comme 16384) donne des informations fréquentielles très précises — vous pouvez voir les notes individuelles clairement — mais la résolution temporelle devient floue. Une taille FFT plus petite (comme 1024) donne une résolution temporelle nette — vous pouvez voir exactement quand un son commence et s'arrête — mais les informations fréquentielles sont moins précises. 4096 est une bonne valeur par défaut qui équilibre les deux. Essayez de changer de taille pour voir la différence.
dB (décibels) mesure l'intensité sonore. Les curseurs de plage dB contrôlent quels niveaux de volume sont visibles dans le spectrogramme. Le curseur Min définit le "plancher" — tout ce qui est plus faible que cette valeur apparaît en noir. Le curseur Max définit le "plafond" — tout ce qui est plus fort apparaît avec la couleur la plus vive. Réduire la plage (par exemple, de -80 dB à 0 dB) augmente le contraste et rend les détails plus discrets visibles. Élargir la plage (par exemple, de -140 dB à 0 dB) montre plus du plancher de bruit. Si votre spectrogramme paraît trop sombre, essayez de relever le curseur Min. S'il paraît saturé, essayez de le baisser.
SoX (par défaut) utilise une palette chaude allant du noir au violet, rouge, orange, jaune jusqu'au blanc. Elle s'inspire de l'outil audio SoX et offre un bon contraste perceptif sur toute la plage. Spectrum utilise une palette arc-en-ciel classique — bleu pour les sons faibles, puis cyan, vert, jaune, jusqu'au rouge pour les sons forts. Elle ressemble à ce que de nombreux outils scientifiques utilisent. Mono est une simple échelle de gris — noir pour le silence, blanc pour les sons forts. Elle est propre et facile à lire, mais montre moins de détails dans les médiums. Choisissez celle qui rend les caractéristiques qui vous intéressent les plus faciles à voir.
Une fonction de fenêtrage est appliquée à chaque segment d'audio avant l'exécution de la FFT. Elle contrôle le compromis entre la précision fréquentielle et la fuite spectrale (flou indésirable entre fréquences adjacentes). Hann (par défaut) est le choix le plus courant — elle offre un bon équilibre et fonctionne bien pour la plupart des audios. Hamming est similaire à Hann mais avec légèrement moins de fuite au prix de lobes principaux plus larges — utile lorsque vous avez besoin d'une séparation plus nette entre des fréquences proches. Blackman-Harris a la meilleure suppression des lobes secondaires des trois — elle produit la séparation fréquentielle la plus nette avec un minimum de fuite, mais chaque bande de fréquence apparaît légèrement plus large. Pour la plupart des musiques et usages généraux, Hann convient parfaitement. Essayez Blackman-Harris si vous souhaitez l'isolation fréquentielle la plus précise.
Linéaire (par défaut) espace toutes les fréquences de manière uniforme — 1 kHz occupe le même espace vertical que 10 kHz. C'est ce que Spek et la plupart des analyseurs de spectre utilisent. Il offre une vue claire du contenu haute fréquence et facilite la détection des coupures dues à la compression avec perte. Logarithmique donne plus d'espace aux fréquences basses, correspondant à notre perception réelle de la hauteur tonale — le saut de 100 Hz à 200 Hz sonne pareil que de 1000 Hz à 2000 Hz (les deux valent une octave). Cela rend l'échelle logarithmique bien plus adaptée à l'analyse musicale, car la plupart du contenu musical (voix, basses, guitares, batterie) se situe en dessous de 5 kHz. Utilisez Linéaire pour inspecter le spectre complet ou vérifier les coupures dues à la compression. Utilisez Logarithmique pour voir les détails musicaux et la séparation des notes.
Pour les fichiers audio en Stereo, le sélecteur de canal vous permet de visualiser le spectrogramme du canal gauche uniquement, du canal droit uniquement, ou d'un Mix des deux (moyenne). C'est utile pour repérer les différences entre les canaux — par exemple, certains instruments peuvent être panoramiqués d'un côté, ou un canal peut contenir des artefacts que l'autre n'a pas. Le sélecteur apparaît uniquement lorsque vous chargez un fichier en Stereo.
Cliquez et faites glisser sur le spectrogramme pour sélectionner une zone rectangulaire — la vue zoomera sur cette région. Vous pouvez zoomer plusieurs fois pour vous rapprocher davantage. Les axes de temps et de fréquences se mettront à jour pour afficher la plage zoomée, et une barre d'informations de zoom apparaîtra indiquant la plage exacte. Pour revenir à la vue complète, soit double-cliquez sur le spectrogramme, soit cliquez sur le bouton Réinitialiser le zoom.
Oui. Les formats avec perte comme MP3 et AAC coupent les hautes fréquences pour économiser de l'espace. Un MP3 à 128 kbps n'a typiquement pas de contenu au-dessus de ~16 kHz. Un MP3 à 320 kbps coupe autour de 20 kHz. Vous verrez une ligne horizontale nette où toute couleur s'arrête brusquement — tout ce qui est au-dessus est noir. En revanche, un vrai fichier sans perte (FLAC, WAV) montre typiquement du contenu jusqu'à la fréquence de Nyquist (la moitié du taux d'échantillonnage). Si quelqu'un prétend qu'un fichier est "hi-res" mais que le spectrogramme montre une coupure nette à 16 kHz, il a probablement été suréchantillonné depuis une source avec perte.
Non. Tout le traitement — décodage, analyse FFT et rendu — s'effectue entièrement dans votre navigateur via l'API Web Audio et JavaScript. Vos fichiers audio ne quittent jamais votre appareil et aucune donnée n'est envoyée à un serveur. Vous pouvez même utiliser cet outil hors ligne une fois la page chargée.