MP3 이후

MP3를 만든 연구소가 다음에 올 것에 대해 이야기하기 시작하면 귀 기울일 가치가 있다. 이는 역사가 또 다른 성공을 보장해서가 아니라, 오디오 포맷이 보도자료의 반짝임이 사라진 후에도 오랜 시간 습관을 형성하는 경향이 있기 때문이다. Fraunhofer가 현재 진행 중인 몰입형, 적응형, 객체 기반 오디오 작업은 미래 지향적인 공학의 익숙한 냄새를 풍긴다. 현업 뮤지션, 믹서, 그리고 일상 청취자에게 흥미로운 부분은 더 단순하다: 이 모든 것이 실제 환경에서 오디오를 더 잘 작동하게 만들 수 있을까?

이것이 현재의 표준이다. 포맷이 똑똑하다고 해서 이기는 것이 아니다. 저렴한 이어폰, 이상한 위치에 놓인 사운드바, 시끄러운 주방의 휴대폰, 폭발음에 묻힌 TV 속 대화, 그리고 아무도 스템 이름 짓는 데 두 시간을 더 쓰고 싶어 하지 않는 음악 세션을 견뎌내야 이긴다. 코덱 이야기는 더 이상 파일을 작게 압축하는 것만이 아니다. 무엇을 고정시키고 무엇을 바꿀 수 있을지 결정하는 문제다.

제안: 소리가 어디에 위치했는지 아는 기술

적응형 오디오는 미래지향적으로 들리지만, 이를 평범한 상점 대화로 바꾸면 다르다. 전통적인 믹스는 대부분 완성된 그림과 같다. 결정을 내리고, 출력하며, 결과물이 스튜디오 모니터에서 자동차 스피커, 그리고 지친 무선 이어폰까지 잘 전달되길 바란다. 객체 기반 시스템은 그 그림을 느슨하게 만든다. 모든 것을 하나의 고정된 블록으로 다루는 대신, 특정 요소들을 위치, 레벨, 동작에 관한 메타데이터와 함께 별도의 객체로 설명할 수 있다.

이론적으로 이는 재생 시스템이 지능적으로 반응할 여지를 만든다. TV는 대화를 더 명확하게 전달할 수 있다. 모바일 기기는 홈 시어터와는 다른 공간감을 구현할 수 있다. 청취자는 타협된 일괄 축소 버전 대신 하드웨어에 맞는 같은 프로그램의 다른 버전을 받을 수 있다.

이것이 깔끔한 판매 제안이며, 터무니없는 말이 아니다. 나쁜 스피커로 빽빽한 믹스를 다뤄본 사람이라면 그 매력을 알 것이다. 재생 체인이 더 많은 정보를 바탕으로 더 나은 선택을 할 수 있다면, 변환 품질이 향상된다. 문제는 유연성을 더할수록 모든 것이 제작되고, 점검되고, 신뢰받아야 한다는 점이다.

뮤지션에게 필요한 것은 마법이 아니라, 나쁜 변환이 줄어드는 것이다.

여기서 나는 유용한 방식으로 조심스러워진다. 대부분의 크리에이터들은 객체 메타데이터를 요구하지 않는다. 그들은 왜 방 안에서 완벽하게 느껴졌던 보컬이 휴대폰에서는 얇고 종이 같은 소리로 들리는지, 왜 거실 사운드바에서는 저음이 뭉개져서 혼탁하게 들리는지 묻는다. 그들은 신뢰성을 원한다.

따라서 고급 오디오 포맷의 실질적인 이유는 단순한 '몰입감'이 아니다. 그 단어는 이미 수많은 데모에서 너무 많이 사용되었다. 실질적인 이유는 기기 간에 깨지지 않는 청취 경험을 더 많이 제공하는 것이다. 적응형 전송이 아티스트가 여섯 개의 별도 마스터를 만들지 않고도 의도를 유지할 수 있다면, 그것이 중요하다.

음악 제작에서는 부담이 낮게 유지되어야 한다. 노트북 세션에서 작업하는 싱어송라이터에게 또 다른 내보내기 미로는 필요 없다. 마감이 임박한 믹스 엔지니어는 모든 수정이 호환성 검사의 분기 트리로 변하는 포맷을 원하지 않는다. 이 기술 주변의 도구들이 익숙한 세션 작업 방식 — 버스, 필요한 곳에 객체, 합리적인 모니터링, 신뢰할 수 있는 다운믹스 — 에 가깝게 워크플로우를 유지할 수 있다면 기회가 있다.

그렇지 않으면, 그것은 주로 컨퍼런스 데모와 소수의 프리미엄 쇼케이스에서만 존재하는 또 다른 인상적인 시스템이 된다.

진짜 병목은 청취가 아니라 제작에 있다

재생 하드웨어는 예전보다 좋아졌고, 소프트웨어 렌더링은 평균 청취자가 생각하는 것보다 훨씬 더 능력 있다. 휴대폰은 공간감을 꽤 잘 흉내 낸다. 헤드폰은 위치 추적이 가능하다. TV와 사운드바는 이미 다양한 신호 조작을 무대 뒤에서 수행한다. 소비자 측은 복잡하지만 황폐하지는 않다.

더 어려운 문제는 상류에 있다. 누군가는 이 모든 적응이 추측이 되지 않도록 자료를 충분히 잘 준비해야 한다. 이는 도구, 표준, 모니터링 신뢰도, 그리고 프로젝트가 한 벤더의 생태계에 갇힌 느낌이 들지 않도록 하는 충분한 상호 운용성을 의미한다.

엔지니어들은 이 상황을 이전에 본 적이 있다. 새로운 포맷이 아름다운 데모와 거친 인계와 함께 등장한다. 창의적인 약속은 현실적이지만, 세션 관리는 까다롭고, 모니터링 환경은 불안정하며, 대체 스테레오 버전은 부수적인 생각처럼 느껴진다. 그런 다음 포맷은 실제로는 워크플로우에 속한 문제들 때문에 비난받는다.

Fraunhofer의 중요성은 단순한 기술 발명에만 국한되지 않습니다. 생산에서 전달까지 이어지는 과정을 너무 많은 불편한 단절 없이 정의하는 데 도움을 줄 수 있다는 점입니다. 하지만 여전히 많은 실질적인 질문들이 남아 있습니다. 대체 렌더링을 청취하는 것은 얼마나 쉬운가? 적응형 결정이 믹스에 해를 끼칠 때 얼마나 명확하게 드러나는가? 소규모 팀이 전문가 없이 이 과정을 얼마나 처리할 수 있는가? 이런 질문들은 화려하지는 않지만, 채택 여부를 결정짓는 중요한 요소입니다.

방송이 음악보다 이를 더 빨리 이해할 수 있다

방송과 라이브 스포츠는 적응형 오디오의 가치를 음악 산업보다 더 빨리 이해하는 경우가 많습니다. 그들은 매우 명확한 문제를 해결해야 하기 때문입니다. 대화 명료성, 대체 언어 피드, 접근성 옵션, 기기별 재생은 추상적인 혜택이 아니라 일상적인 운영상의 골칫거리입니다.

음악은 감정적 계약이 다르기 때문에 더 까다롭습니다. 아티스트와 믹서는 고정된 밸런스, 정확한 공간 선택, 그리고 레코드에 생명을 불어넣는 작은 우연의 요소에 깊은 애정을 갖는 경향이 있습니다. 재생 체인에 너무 많은 자유를 주면, 시스템이 몰래 곡을 리믹스하고 있다고 합리적으로 걱정하기 시작합니다.

그렇다고 음악이 적합하지 않다는 뜻은 아닙니다. 음악에는 안전장치가 필요하다는 의미입니다. 포맷은 의도를 존중하면서도 다양한 청취 환경에서 도움이 될 수 있을 만큼 충분한 유연성을 제공해야 합니다. 믹스를 기계가 완전히 장악하는 것이 아니라, 스트레스 상황에서 믹스를 보존하는 시스템이라고 생각하는 편이 좋습니다.

이 구분은 앞으로 몇 년 동안 중요해질 것입니다. 창작자들은 스마트한 전달은 받아들이겠지만, 보이지 않는 재해석에는 반대할 것입니다.

실제로 레코드를 만드는 사람이라면 주목할 점

뮤지션, 프로듀서, 믹서라면 적응형 오디오가 '미래'인지 여부가 중요한 질문이 아닙니다. 그 표현은 많은 괜찮은 도구들을 묻어버렸습니다. 대신 시스템이 성숙해지고 있음을 증명할 징후가 무엇인지 물어보는 것이 더 유용합니다.

먼저, 가장 좋은 의미에서 평범하게 느껴지는 제작 도구를 주목하라. 이것이 기존 세션 로직과 더 닮을수록 더 좋다. 둘째, 신뢰할 수 있는 모니터링과 다운믹스 동작을 주목하라. 제작자가 청취자가 무엇을 들을지 예측할 수 없다면 신뢰는 빠르게 무너진다. 셋째, 영웅적인 기술 지원을 필요로 하지 않는 전달 경로를 주목하라. 이상적인 데모 체인 내에서만 작동하는 포맷은 틈새 시장에 머문다.

또한 누가 먼저 혜택을 받는지 주목하라. 그것이 앨범 프로젝트가 아닐 수도 있다. 방송사, 스트리머, 게임 오디오 팀, 혹은 여러 엔드포인트에 하나의 소스를 제공해야 하는 하이브리드 미디어 제작자일 수도 있다. 이는 실패가 아니다. 많은 오디오 기술은 뮤지션들이 더 깔끔하고 합리적인 버전을 얻기 전에 인접 분야에서 성숙해진다.

독립 아티스트에게 가장 좋은 결과는 보이지 않는 능력일 것이다. 레코드를 만들고, 특별한 처리가 필요한 부분을 정의하면 시스템이 그것을 전달하는 데 도움을 준다. 의례적인 복잡함도 없고, 포맷 관리를 위한 부업을 하는 느낌도 없다.

MP3에서 얻는 교훈은 사람들이 생각하는 것과 다르다

사람들은 MP3를 압축의 획기적인 발전으로 기억한다. 실제로 그랬다. 또한 MP3가 가능하게 한 것들, 즉 휴대성, 공유, 편리함, 그리고 이상적인 조건 밖에서 듣는 것에 대한 완전히 새로운 관용도 기억한다. 더 깊은 교훈은 사람들이 오디오 기술을 채택하는 이유가 기존 시스템보다 일상 행동에 더 잘 맞기 때문이라는 점이다.

그것이 Fraunhofer의 최신 아이디어들이 직면한 기준이다. 엔지니어링은 인상적일 수 있다. 데모는 설득력 있을 수 있다. 하지만 그것이 진짜 질문을 해결하지는 못한다. 적응형 및 객체 기반 오디오가 스튜디오와 청취자 사이에서 소리가 깨지는 횟수를 줄일 수 있느냐는 것이다.

만약 답이 '그렇다'가 된다면, 제작자들은 그것을 위한 공간을 찾을 것이다. 또 다른 포맷 약어를 간절히 원해서가 아니라, 한 세트의 결정을 내리고도 여섯 가지 다른 실패를 듣는 것에 지쳤기 때문이다. 다음 의미 있는 오디오 발전은 내부적으로는 정교해 보일 수 있지만, 가장 큰 성과는 방을 떠날 때 믹스가 형태를 유지하는 것처럼 멋지게 평범할 수 있다.