스마트폰 마이크 배열 (마이크 구조, 노이즈 제거, 빔포밍)

통화 품질이 나쁠 때, 혹시 네트워크만 탓하고 있지는 않으셨나요? 그런데 어느 날 지하철에서 통화하다가 문득 이런 생각이 들었습니다. 같은 장소에서 구형 폰과 최신 폰으로 통화했는데, 상대방이 들리는 소음 차이가 꽤 크게 났거든요. 알고 보니 문제는 마이크 구조였습니다. 

스마트폰 통화 품질은 단순히 통신 상태만으로 결정되지 않습니다. 같은 네트워크 환경에서도 상대방의 목소리가 또렷하게 들리거나, 주변 소음이 크게 섞여 들리는 경우가 있습니다. 이러한 차이는 스마트폰 마이크 구조와 배열 방식에서 발생합니다. 스마트폰 안에 마이크가 몇 개나 들어있는지, 그리고 그게 통화에 어떤 영향을 주는지 정리해 봤습니다.

마이크가 하나라고 생각했다면, 한 번 뒤집어보세요

스마트폰 마이크가 하나라고 오랫동안 생각했습니다. 전화할 때 입 근처에 구멍 하나 있으면 충분한 거 아닌가 싶었으니까요. 그런데 요즘 플래그십 스마트폰을 분해한 사진을 보면, 마이크 모듈이 2개에서 많게는 4개까지 들어가 있습니다. 이게 단순히 "더 잘 들리라고" 넣은 게 아닙니다.

초기 스마트폰은 단일 마이크 구조를 사용했습니다. 단일 마이크란 하나의 음향 수집 소자가 주변의 모든 소리를 무차별적으로 받아들이는 방식입니다. 첫 스마트폰이 딱 이 구조였는데, 카페에서 전화하면 상대방이 "거기 공사현장이야?"라고 물어볼 정도로 소음이 그대로 전달됐습니다. 지금 생각하면 웃기지만, 당시엔 그냥 통신사 문제인 줄만 알았습니다.

그 한계를 극복하기 위해 등장한 것이 다중 마이크 배열(Multi-mic Array) 구조입니다. 다중 마이크 배열이란 2개 이상의 마이크를 서로 다른 위치에 배치해 각각 다른 음향 정보를 수집하는 방식을 뜻합니다. 핵심은 두 마이크가 수집한 신호를 서로 비교한다는 점입니다. 사용자 입에서 가까운 하단 마이크와 멀리 떨어진 상단 마이크가 같은 소리를 들었다면, 그건 주변 소음일 가능성이 높습니다. 반대로 하단 마이크에만 강하게 잡히는 소리는 사용자 음성으로 판단합니다. 이 비교 과정 자체가 노이즈 제거의 출발점입니다.

국제전기통신연합(ITU) 음성 품질 평가 기준에 따르면, 통화 품질을 결정하는 요소 중 배경 소음 처리 성능이 체감 품질에 직접적인 영향을 미친다고 명시하고 있습니다. 단순히 마이크 개수의 문제가 아니라, 수집된 신호를 어떻게 처리하느냐가 핵심이라는 뜻입니다.

노이즈 제거와 빔포밍, 실제로 어떻게 다를까요

다중 마이크 구조를 이야기할 때 빠지지 않는 두 가지 기술이 있습니다. 노이즈 캔슬링(Noise Canceling)과 빔포밍(Beamforming)입니다. 이 둘을 같은 개념으로 묶어서 이해하는 분들이 많은데, 작동 방식이 꽤 다릅니다.

노이즈 캔슬링이란 두 마이크가 수집한 신호의 차이를 분석해 공통적으로 잡힌 소음 성분을 수학적으로 상쇄시키는 기술입니다. 이때 사용되는 핵심 알고리즘이 적응형 필터링(Adaptive Filtering)인데, 이는 주변 소음의 주파수와 파형을 실시간으로 학습해 역위상 신호를 생성하는 방식입니다. 역위상 신호란 원래 소음과 파형이 정반대여서 더해지면 서로 상쇄되는 신호입니다. 제가 차 안에서 통화할 때 엔진 소음이 생각보다 잘 걸러지는 게 바로 이 원리 덕분이었습니다.

반면 빔포밍은 방향성의 문제입니다. 빔포밍이란 여러 마이크의 신호 도달 시간 차이를 이용해 특정 방향에서 오는 소리만 선택적으로 강화하는 기술입니다. 안테나가 전파를 특정 방향으로 집중시키는 것과 유사한 원리입니다. 시끄러운 식당에서 통화할 때, 입을 마이크 방향으로 향하게 했더니 체감 품질이 달라졌습니다. 처음엔 우연인 줄 알았는데, 빔포밍 원리를 알고 나서야 이해가 됐습니다.

이 두 기술이 어떤 환경에서 효과 차이를 보이는지 정리했습니다.

  1. 조용한 실내: 단일 마이크와 차이가 크지 않습니다. 노이즈 처리 필요성 자체가 낮기 때문입니다.
  2. 시끄러운 거리나 지하철: 노이즈 캔슬링 효과가 두드러집니다. 주변 소음 성분이 명확하게 분리됩니다.
  3. 차량 내부: 엔진 소음처럼 지속적인 저주파 소음에 적응형 필터링이 효과적입니다.
  4. 영상 촬영 상황: 빔포밍으로 피사체 방향 소리를 강조하고 측면 소음을 억제합니다.
  5. 바람 많은 야외: 이 환경은 솔직히 아직도 어떤 폰이든 완전하지 않다고 느낍니다. 풍잡음(Wind Noise)은 파형이 불규칙해서 알고리즘이 예측하기 어렵습니다.

또한 최근 스마트폰에는 머신러닝 기반의 음성 분리 알고리즘도 적용되기 시작했습니다. Google AI 블로그에 따르면, 딥러닝 모델을 활용해 음성 신호의 패턴을 학습시킨 뒤 소음 환경에서 음성 성분만 추출하는 방식이 실제 기기에 탑재되고 있다고 밝히고 있습니다. 하드웨어 마이크 배열과 소프트웨어 알고리즘이 함께 작동하는 구조라는 점이 제가 꽤 흥미롭게 생각한 부분입니다.

결국 사용 습관이 성능을 갈라놓습니다

마이크 배열과 알고리즘이 아무리 정교해도, 사용 방식에 따라 성능이 크게 달라진다는 걸 경험해보기 전까지는 몰랐습니다. 케이스를 바꾸고 나서 통화 품질이 갑자기 나빠진 적이 있었는데, 알고 보니 후면 케이스가 상단 마이크 구멍을 살짝 막고 있었습니다. 상단 마이크는 주변 소음을 감지하는 기준 신호를 수집하는 역할을 하기 때문에, 이 마이크가 막히면 노이즈 캔슬링 알고리즘이 정상적으로 작동하지 않습니다. 케이스를 교체하고 나서 바로 해결됐습니다.

통화 품질을 유지하는 데 실질적으로 중요한 체크 포인트는 아래로 요약됩니다. 하단 마이크를 손바닥으로 무의식적으로 덮고 통화하는 습관, 마이크 구멍이 정렬되지 않은 케이스 사용, 그리고 마이크 홀에 이물질이 쌓이는 경우입니다. 세 번째는 특히 간과하기 쉬운데, 주머니 속 먼지나 파우더가 조금씩 쌓이면 음향 수집 자체가 막혀버립니다. 얇은 솔로 가볍게 털어주는 것만으로도 확연히 달라지는 걸 직접 확인했습니다.

영상 촬영에서도 마이크 배열을 의식하면 결과가 달라집니다. 스테레오 녹음(Stereo Recording)이란 두 개 이상의 마이크가 좌우 혹은 전후 방향의 소리를 독립적으로 수집해 공간감을 재현하는 방식입니다. 촬영 방향을 정하고 나면, 피사체가 어느 마이크 쪽을 향하는지 한 번만 더 확인해 보시는 걸 권해드립니다. 저도 이걸 알기 전에는 왜 같은 환경인데 어떤 영상은 소리가 선명하고 어떤 건 평평하게 들리는지 이해를 못 했습니다.

스마트폰 마이크는 결국 하드웨어와 소프트웨어, 그리고 사용자 습관이 세 박자를 맞춰야 제대로 작동합니다. 고성능 마이크 배열이 들어간 폰을 쓰면서도 케이스 하나 때문에 그 성능을 절반도 못 쓰는 경우가 생각보다 많습니다. 지금 당장 본인 폰의 마이크 위치를 한번 확인해 보시는 것만으로도 통화 품질이 달라질 수 있습니다.


스마트폰 관련 글 더보기

이 블로그의 인기 게시물

스마트폰 햅틱 기술 (진동 모터, 촉각 피드백, LRA 방식)

스마트폰 자동 앱 실행되는 이유와 끄는 방법 (백그라운드 관리와 성능 유지 기준)