동물과의 소통, AI와 머신러닝이 여는 새로운 가능성
[디지털비즈온 송민경 기자] 인공지능(AI)과 머신러닝 기술을 활용해 동물 간 소통 방식을 이해하는 데 획기적인 진전을 생길 것을 기대하는 과학계의 낙관론이 커지고 있다.
이는 인류가 오랜 시간 품어온 "동물들은 서로 무엇을 말하고 있는가?"라는 질문에 답하려는 시도의 중요한 이정표가 될 것이다. 이러한 기대감은 콜러-둘리틀 상(Coller-Dolittle Prize)과 같은 프로그램에서도 드러난다. 콜러-둘리틀 상은 동물 소통의 "코드"를 해독한 과학자들에게 최대 50만 달러의 상금을 제공하며, 최근 머신러닝과 대규모 언어 모델(LLMs)의 발전으로 인한 가능성을 보여주어 이를 WIRED, 뮌헨 아이 등 외신에서 보도했다.
동물 소통을 연구하는 많은 그룹은 동물의 소리를 해석할 수 있는 알고리즘을 개발하기 위해주력하고 있음을 공개했다.
지구 종 프로젝트(Earth Species Project)에서 제작하여 공개된 AI 'NatureLM'는 동물의 언어 유형뿐만 아니라 동물의 대략적인 나이, 고통 또는 놀이를 나타내는지 등의 기타 정보를 식별할 수 있는 AI 언어 모델으로 인간의 언어, 환경 소리 및 기타 데이터의 조합에 대해 훈련했다고 알려졌다.
지구 종 프로젝트(Earth Species Project)의 CEO인 케이티 자카리안(Katie Zacarian)은 최근 샌프란시스코에서 열린 악시오스 AI+ 서밋(Axios AI+ Summit)에서 NatureLM를 시연하며, 동물의 언어를 번역할 때 문제점은 동물의 의사 소통 방법에 대한 이해가 제한적임을 밝혔다.
프로젝트 CETI는 향유고래와 혹등고래의 소리를 해독하려는 작업을 진행 중이라고 밝혔으며, 현재의 기계 학습 기술은 방대한 양의 고품질 데이터가 필요하며, 그에 반해 동물 소통과 관련된 데이터는 아직 충분하지 않다고 덧붙였다.
인간 언어 데이터를 활용하는 LLM(ChatGPT 등)은 인터넷에 존재하는 방대한 텍스트 데이터를 학습할 수 있지만, 고품질의 동물 소통 데이터는 양과 질 모두 제한적이다. LLM은 500GB 이상의 텍스트 정보를 기반으로 구축되었지만, 향유고래 의사소통에 대한 프로젝트 CETI의 연구는 8,000개 이상의 발성에만 접근했음을 공개했다. 이러한 불균형은 연구자들이 동물의 의사소통에 대한 포괄적인 이해를 확립하는 데 직면하는 어려움을 밝혔다.
이러한 한계를 극복하기 위해, 2025년에는 저비용 음향 기록 장치인 오디오모스(AudioMoth)와 같은 기술의 확산으로 더 많은 동물 소통 데이터를 확보할 수 있을 것으로 보인다. 이러한 장치는 숲이나 정글에서 새와 원숭이 소리를 24시간 기록할 수 있어, 데이터 수집의 효율성을 크게 높일 수 있음을 공개했다.
과거에는 수집된 데이터를 수동으로 분석하기 어려웠으나, 현재는 합성곱 신경망(CNN) 기반 자동 탐지 알고리즘이 수천 시간 분량의 녹음을 분석하고 동물 소리를 분류하는 데 유용하게 사용되고 있다. 이처럼 축적된 대규모 데이터는 딥러닝 기술을 활용해 동물 발성의 숨겨진 구조를 발견하고 이를 인간 언어의 구조와 비교할 수 있는 새로운 분석 알고리즘 개발의 가능성을 열어준다.
Interspecies.io와 같은 단체는 종족간 의사소통을 인간이 이해할 수 있는 신호로 변환하는 것을 명시적으로 목표로 하며, 이는 동물의 소리를 인간의 언어로 변환하는 목표를 공개했지만, 대부분의 과학자들은 동물들이 인간과 같은 언어를 가지고 있지 않다고 본다. 따라서 "번역"보다는 "해독"이라는 현실적인 목표가 더욱 적합하다는 의견이 지배적이다.