Question 1

Qu'est-ce qu'un spectrogramme ?

Accepted Answer

Un spectrogramme est une représentation visuelle de l'évolution des fréquences d'un fichier audio dans le temps. Pensez-y comme une carte de chaleur pour le son. L'axe horizontal représente le temps (de gauche à droite, du début à la fin du fichier). L'axe vertical représente la fréquence (bas = graves, haut = aigus). La couleur à chaque point indique le volume de cette fréquence à cet instant — les couleurs vives signifient fort, le sombre signifie faible ou silencieux.

Question 2

Comment lire un spectrogramme ?

Accepted Answer

Les lignes brillantes horizontales indiquent des tonalités soutenues à une fréquence spécifique. Les colonnes brillantes verticales indiquent des éclats soudains d'énergie sur toutes les fréquences (comme un coup de batterie). Une bande brillante en bas qui reste constante est généralement la basse ou les voix. Une coupure nette où toutes les couleurs s'arrêtent brusquement indique généralement un format lossy comme le MP3. Le silence apparaît comme des zones sombres.

Question 3

Que signifie la taille FFT ?

Accepted Answer

FFT signifie Fast Fourier Transform — c'est le calcul qui décompose l'audio en fréquences individuelles. La taille FFT contrôle le compromis entre le détail de fréquence et le détail temporel. Une taille FFT plus grande (comme 16384) donne des informations de fréquence très précises, mais la résolution temporelle devient floue. Une taille plus petite (comme 1024) donne une résolution temporelle nette, mais les informations de fréquence sont moins précises. 4096 est un bon compromis par défaut.

Question 4

Qu'est-ce que la plage dB et comment la régler ?

Accepted Answer

Le dB (décibel) mesure le volume sonore. Les curseurs de plage dB contrôlent les niveaux de volume visibles dans le spectrogramme. Le curseur Min définit le plancher — tout ce qui est plus silencieux apparaît en noir. Le curseur Max définit le plafond — tout ce qui est plus fort apparaît dans la couleur la plus vive. Réduire la plage augmente le contraste. Si votre spectrogramme est trop sombre, relevez le curseur Min.

Question 5

Quelles sont les différentes palettes de couleurs ?

Accepted Answer

SoX (par défaut) utilise une palette chaude allant du noir au violet, rouge, orange, jaune et blanc. Spectre utilise une palette arc-en-ciel classique — bleu pour le calme, jusqu'au rouge pour le fort. Mono est un simple niveau de gris — noir pour le silence, blanc pour le fort.

Question 6

À quoi servent les fonctions de fenêtrage (Hann, Hamming, Blackman-Harris) ?

Accepted Answer

Une fonction de fenêtrage est appliquée à chaque segment audio avant le calcul FFT. Elle contrôle le compromis entre la précision de fréquence et la fuite spectrale. Hann (par défaut) est le choix le plus courant — bon équilibre pour la plupart des audios. Hamming est similaire à Hann avec légèrement moins de fuite. Blackman-Harris offre la meilleure suppression des lobes secondaires pour une séparation de fréquences maximale.

Question 7

Quelle est la différence entre l'échelle linéaire et logarithmique ?

Accepted Answer

Linéaire (par défaut) espace toutes les fréquences uniformément — 1 kHz occupe le même espace vertical que 10 kHz. C'est ce qu'utilisent Spek et la plupart des analyseurs. Logarithmique donne plus de place aux fréquences basses, correspondant à la perception humaine de la hauteur — meilleure pour analyser la musique car la plupart du contenu musical vit en dessous de 5 kHz.

Question 8

À quoi sert le sélecteur de canal ?

Accepted Answer

Pour les fichiers audio stéréo, le sélecteur de canal vous permet de voir le spectrogramme du canal Gauche uniquement, du canal Droit uniquement, ou d'un Mixage des deux (moyenne). Utile pour repérer les différences entre les canaux — certains instruments peuvent être panoramiqués d'un côté, ou un canal peut contenir des artefacts que l'autre n'a pas.

Question 9

Comment zoomer sur le spectrogramme ?

Accepted Answer

Cliquez et faites glisser sur le spectrogramme pour sélectionner une zone rectangulaire — la vue zoomera sur cette région. Vous pouvez zoomer plusieurs fois. Les axes de temps et de fréquence se mettront à jour pour afficher la plage zoomée. Pour revenir à la vue complète, double-cliquez sur le spectrogramme ou cliquez sur le bouton Réinitialiser le zoom.

Question 10

Puis-je repérer un audio lossy avec un spectrogramme ?

Accepted Answer

Oui. Les formats lossy comme le MP3 et l'AAC coupent les hautes fréquences pour économiser de l'espace. Un MP3 à 128 kbps n'a généralement aucun contenu au-dessus de ~16 kHz. Un MP3 à 320 kbps coupe à environ 20 kHz. Vous verrez une ligne horizontale nette où toutes les couleurs s'arrêtent brusquement. Un vrai fichier lossless (FLAC, WAV) montre du contenu jusqu'à la fréquence Nyquist.

Question 11

Mon audio est-il téléversé vers un serveur ?

Accepted Answer

Non. Tout le traitement — décodage, analyse FFT et rendu — se déroule entièrement dans votre navigateur via la Web Audio API et JavaScript. Vos fichiers audio ne quittent jamais votre appareil et aucune donnée n'est envoyée à un serveur. Vous pouvez même utiliser cet outil hors ligne une fois la page chargée.

Spectrogramme

Visualisez votre spectre audio

Foire aux questions