스펙트로그램 뷰어
오디오 스펙트럼을 시각화하세요
모든 오디오 파일의 전체 주파수 콘텐츠를 시간에 따라 확인하세요. FFT 크기, 컬러 팔레트, dB 범위 조정 가능. Spek과 비슷하지만 브라우저에서 바로 사용할 수 있어요.
오디오 파일을 여기에 드래그하세요
또는 클릭하여 파일 선택
FLAC
WAV
AIFF
MP3
AAC
OGG
M4A
OPUS
자주 묻는 질문
스펙트로그램은 오디오 파일의 주파수가 시간에 따라 어떻게 변하는지를 시각적으로 나타낸 것이에요. 소리의 열지도라고 생각하면 돼요. 가로축은 시간(왼쪽에서 오른쪽, 파일의 시작부터 끝)을 나타내고, 세로축은 주파수(아래 = 저음, 위 = 고음)를 나타내요. 각 지점의 색깔은 그 순간의 주파수 크기를 보여줘요 — 밝은 색은 크고, 어두운 색은 조용하거나 무음이에요.
수평으로 밝은 선은 특정 주파수에서 지속되는 음이나 음표를 나타내요. 수직으로 밝은 열은 모든 주파수에 걸친 갑작스러운 에너지 폭발(드럼 히트나 클릭 소리 등)을 나타내요. 하단의 일정하게 밝은 띠는 보통 베이스나 보컬이에요. 날카로운 절단선(예: 16 kHz 이상에서 아무것도 없는 경우)은 MP3 같은 손실 압축 형식을 나타내요 — 무손실 파일은 보통 Nyquist 주파수까지 콘텐츠가 있어요. 무음은 어둡거나 검은 영역으로 나타나요. 스펙트로그램을 클릭하고 드래그하여 특정 구간을 더 자세히 확인할 수 있어요.
FFT는 Fast Fourier Transform의 약자로, 오디오를 개별 주파수로 분해하는 수학적 연산이에요. FFT 크기는 주파수 세부 정보와 시간 세부 정보 사이의 균형을 조절해요. 더 큰 FFT 크기(예: 16384)는 매우 정밀한 주파수 정보를 제공하지만 시간 해상도가 낮아져요. 더 작은 FFT 크기(예: 1024)는 시간 해상도가 높아져 소리의 시작과 끝을 정확히 볼 수 있지만 주파수 정보는 덜 정확해요. 4096은 두 가지를 균형 있게 맞추는 좋은 기본값이에요. 다양한 크기를 전환해보며 차이를 확인해 보세요.
dB(데시벨)는 소리의 크기를 측정해요. dB 범위 슬라이더는 스펙트로그램에서 보이는 음량 수준을 제어해요. 최솟값 슬라이더는 '하한선'을 설정하며 — 이 값보다 조용한 것은 검정으로 표시돼요. 최댓값 슬라이더는 '상한선'을 설정하며 — 이보다 큰 소리는 가장 밝은 색으로 표시돼요. 범위를 좁히면(예: -80 dB ~ 0 dB) 대비가 높아지고 조용한 세부 사항이 더 잘 보여요. 범위를 넓히면(예: -140 dB ~ 0 dB) 배경 노이즈가 더 잘 보여요. 스펙트로그램이 너무 어두우면 최솟값 슬라이더를 높여 보세요. 너무 밝으면 낮춰 보세요.
SoX(기본값)는 검정에서 보라, 빨강, 주황, 노랑, 흰색으로 이어지는 따뜻한 팔레트를 사용해요. SoX 오디오 도구에서 영감을 받았으며 전체 범위에 걸쳐 좋은 지각 대비를 제공해요. Spectrum은 클래식 무지개 팔레트를 사용해요 — 조용한 것은 파란색, 시안, 초록, 노랑을 거쳐 큰 소리는 빨간색으로 표시돼요. 많은 과학 도구와 유사해요. Mono는 단순한 회색조예요 — 무음은 검정, 큰 소리는 흰색. 깔끔하고 읽기 쉽지만 중간 범위의 세부 사항은 덜 보여요. 원하는 기능이 가장 잘 보이는 팔레트를 선택하세요.
윈도우 함수는 FFT 실행 전 각 오디오 청크에 적용돼요. 주파수 정밀도와 spectral leakage(인접 주파수 간 원치 않는 번짐) 사이의 균형을 제어해요. Hann(기본값)은 가장 일반적인 선택으로 좋은 균형을 제공하며 대부분의 오디오에 잘 작동해요. Hamming은 Hann과 비슷하지만 leakage가 약간 적은 대신 메인 로브가 약간 더 넓어요 — 가까운 주파수 간 더 깔끔한 분리가 필요할 때 유용해요. Blackman-Harris는 세 가지 중 최고의 사이드로브 억제를 제공해요 — 최소한의 leakage로 가장 깔끔한 주파수 분리를 만들지만 각 주파수 대역이 약간 더 넓게 나타나요. 대부분의 음악과 일반 사용에는 Hann으로 충분해요.
선형(기본값)은 모든 주파수를 균등하게 배치해요 — 1 kHz와 10 kHz가 같은 세로 공간을 차지해요. Spek과 대부분의 스펙트럼 분석기가 사용하는 방식이에요. 고주파 콘텐츠를 명확히 보여주고 손실 압축 차단점을 발견하기 쉬워요. 로그는 낮은 주파수에 더 많은 공간을 부여해 우리가 음높이를 인식하는 방식과 일치해요 — 100 Hz에서 200 Hz의 차이는 1000 Hz에서 2000 Hz의 차이와 같게 들려요(둘 다 한 옥타브). 음악 분석에 더 적합하며, 대부분의 음악 콘텐츠(보컬, 베이스, 기타, 드럼)가 5 kHz 이하에 위치해요.
스테레오 오디오 파일의 경우, 채널 선택기를 통해 왼쪽 채널만, 오른쪽 채널만, 또는 두 채널의 혼합(평균)으로 스펙트로그램을 볼 수 있어요. 채널 간 차이를 파악하는 데 유용해요 — 예를 들어, 일부 악기는 한쪽으로 팬닝되거나, 한 채널에만 아티팩트가 있을 수 있어요. 스테레오 파일을 불러올 때만 선택기가 나타나요.
스펙트로그램을 클릭하고 드래그하여 직사각형 영역을 선택하면 해당 영역으로 확대돼요. 여러 번 확대하여 더 가까이 볼 수 있어요. 시간 및 주파수 축이 업데이트되어 확대된 범위를 표시하고, 정확한 범위를 보여주는 줌 정보 바가 나타나요. 전체 보기로 돌아가려면 스펙트로그램을 더블 클릭하거나 줌 초기화 버튼을 클릭하세요.
네. MP3와 AAC 같은 손실 형식은 공간 절약을 위해 고주파를 차단해요. 128 kbps MP3는 보통 ~16 kHz 이상의 콘텐츠가 없어요. 320 kbps MP3는 약 20 kHz에서 차단돼요. 색깔이 갑자기 멈추는 날카로운 수평선이 보이면 위는 모두 검정이에요. 반면 진짜 무손실 파일(FLAC, WAV)은 Nyquist 주파수(sample rate의 절반)까지 콘텐츠가 있어요. 파일이 "hi-res"라고 하는데 스펙트로그램에서 16 kHz에서 차단이 보이면, 손실 압축 소스에서 업샘플링된 것일 가능성이 높아요.
아니요. 디코딩, FFT 분석, 렌더링을 포함한 모든 처리는 Web Audio API와 JavaScript를 사용하여 브라우저에서 완전히 이루어져요. 오디오 파일은 절대 기기를 벗어나지 않으며 서버로 데이터가 전송되지 않아요. 페이지가 로드되면 오프라인에서도 이 도구를 사용할 수 있어요.