“음성 AI”… 시장 확대의 선결 과제

보안과 프라이버시 문제 해결 음성 AI 성능 향상 다양한 응용 서비스와 킬러 서비스의 등장

2023-08-01     김맹근 기자
사진 : pixabay

[디지털비즈온 김맹근 기자] 보안과 프라이버시 문제 해결은 음성 AI 시장은 스마트폰의 뒤를 잇는 차세대 단말과 서비스 시장으로 각광받고 있지만, 스마트폰과 같은 거대 시장이 형성되기 위해서는 해결되어야 할 선결 과제가 많다. 가장 시급한 것은 보안과 프라이버시에 대한 대책이다. 가정의 거실과 방 곳곳에 위치한 스마트 스피커는 항시 실행을 대기하면서 사용자의 모든 음성 대화를 수집할 수 있다는 문제를 안고 있다.

2019년 4월에는 아마존이 세계 전역에서 수천 명의 인력을 동원해 아마존 에코 스마트 스피커로 사용자의 음성 명령을 녹음해왔다는 사실이 드러나 논란이 되기도 했다. 애플 시리와 구글 어시스턴트 또한 이러한 음성 명령 녹음 논란에서 자유롭지 못하다.

음성 AI 기능이 딥러닝 방식으로 기존의 음성 명령을 학습하면서 성능이 향상되기 때문에, 개발 과정에서의 음성 데이터 수집은 피할 수 없는 작업으로 여겨지고 있기 때문이다. 따라서 업계에서는 사용자의 음성 데이터 수집과 활용 시 개인 정보와 프라이버시를 엄격하게 보호할 수 있는 방안을 마련하는 것이 중요하다고 보고 있다.

구글은 자사의 스마트 스피커 단말인 구글 홈에 음성 입력 버튼을 탑재해 버튼을 눌렀을 때만 음성 데이터를 받아들이도록 하는 기능을 탑재하고 있지만, 이 같은 방식은 스마트 스피커를 사용하기 위해 버튼을 항상 눌러야만 하는 불편함을 가져올 수밖에 없다.

결국 음성 데이터의 프라이버시 문제를 해결하면서도 기기의 편의성과 성능 향상을 담보할 수 있는 대책 마련이 필요하다. 또한 음성을 결제에 활용하는 보이스 커머스에서는 보안성 확보도 필요하다. 누군가가 사용자의 음성을 녹음해 보이스 결제에 도용하거나, 해킹을 통한 결제가 일어나지 않도록 방지할 수 있는 장치가 요구된다.

음성 AI 성능 향상

음성 AI의 인식 정확도가 사람을 뛰어넘는 95% 이상 수준까지 발전했지만, 아직도 실제 음성 AI 단말과 서비스를 사용하는 사람들은 여러 불편함을 호소하고 있다. 그 중 하나는 문맥을 이해하지 못하는 음성 AI의 한계다. 예를 들어 다소 복잡한 문장이나 두 단계에 걸쳐 이뤄지는 질문을 음성 AI에게 제시할 경우 엉뚱한 명령을 실행하거나 수행 불가능이라고 응답하는 것과 같이 질문의 해석에 어려움을 겪는 경우가 많다.

따라서 문맥을 정확하게 이해하는 음성 AI를 개발하는 것은 향후 음성 AI 단말과 서비스의 성능과 효용성을 크게 향상시키는 데 기여할 수 있다. 다만, 문맥 해석을 위해서는 다층적으로 해석될 수 있는 여러 정황 정보를 파악하고 여러 가지 경우의 수에서 최적의 답을 찾아내는 작업이 필요해, 문맥을 이해하는 AI 개발에는 아직도 많은 연구와 개발이 필요할 것으로 전망된다.

다양한 응용 서비스와 킬러 서비스의 등장

알렉사 스킬과 구글 액션과 같은 확장 기능의 급속한 증가로 음성 AI에서 사용할 수 있는 서비스도 급격하게 증가했다. 양적으로는 크게 증가했음에도, 아직 음성 AI의 특징을 살린 꼭 사용해야만 하는(Must-use) 서비스는 눈에 띄지 않는 것이 사실이다. 앞으로도 음성 AI의 응용 서비스는 지속적으로 증가할 것으로 보이지만, 음성 AI 시장의 규모 확대와 주류 시장 자리매김을 위해서는 킬러 서비스의 등장이 필요하다.

창의성 실험에서 밝혀진 것처럼 양적인 증가가 동시에 창의적인 성과의 증가로도 이어지듯이, 확장 기능의 양적 확대는 서비스의 질적 향상과 킬러 서비스의 개발로도 연결될 수 있다. 이를 위해서는 다양한 실험적인 서비스들의 시도와 함께, 사용자들의 수요에 맞춰 원하는 바를 충족시키는 파급력이 높은 서비스의 개발이 요구된다.

또한 음성만이 담고 있는 ‘정체성’과 ‘감정’을 효과적으로 활용하는 것도 음성 AI 서비스의 성공을 가져올 수 있는 중요한 요소로 평가된다. 예를 들어 네이버 클로바 스마트 스피커의 음성으로 배우 ‘유인나’를 사용한 사례는 유명 인사의 음성으로 사용자에게 친숙함과 감정적인 효과를 일으키려는 의도를 갖고 있다.

이와 같이 사용자의 감정과 심리를 효과적으로 활용하는 서비스가 음성 AI만이 가질 수 있는 강점을 드러내며 더 많은 호응을 얻게 될 가능성이 높다.