[디지털비즈온 김맹근 기자] 산업 전반에 걸쳐 AI는 기계 구동 컴퓨팅으로 혁신을 극대화하고 있다. 금융에서 은행가들은 사기를 더 빨리 감지하고 계좌를 안전하게 유지하기 위해 AI를 사용하고 있고, 통신사들은 우수한 서비스를 제공하기 위해 네트워크를 개선하고 있고, 과학자들은 희귀 질병에 대한 새로운 치료법을 개발하고 있고, 유틸리티 회사들은 더 깨끗해지고 있다. 더 신뢰할 수 있는 에너지 그리드와 자동차 회사들은 자율주행 자동차를 더 안전하고 접근성을 높여주고 있다.
엔비디아의 벤 올리베리에 의하면, 최고의 AI 사용 사례의 핵심은 데이터이다. 효과적이고 정확한 AI 모델을 위해서는 광범위한 데이터 세트에 대한 교육이 필요한다. AI의 힘을 활용하고자 하는 기업은 다양한 소스에서 데이터를 추출하여 일관된 형식으로 변환하고 효율적으로 저장하는 데이터 파이프라인을 구축해야 한다.
데이터 과학자들은 실제 애플리케이션에서 최적의 성능을 위해 AI 모델을 미세 조정하기 위해 여러 실험을 통해 데이터 세트를 개선하기 위해 노력한다. 음성 비서에서 개인화된 추천 시스템에 이르기까지 이러한 애플리케이션은 실시간 성능을 제공하기 위해 대용량 데이터를 신속하게 처리해야 한다.
AI 모델이 복잡해지고 텍스트, 오디오, 이미지 및 비디오와 같은 다양한 데이터 유형을 처리하기 시작함에 따라 신속한 데이터 처리의 필요성이 더욱 중요해지고 있다. 레거시 CPU 기반 컴퓨팅에 계속 의존하는 조직은 데이터 병목 현상, 데이터 센터 비용 증가 및 부족한 컴퓨팅 기능으로 인해 혁신 및 성능 저하에 어려움을 겪고 있다.
많은 기업들이 AI를 운영에 통합하기 위해 가속 컴퓨팅으로 눈을 돌리고 있다. 이 방법은 GPU, 전문 하드웨어, 소프트웨어 및 병렬 컴퓨팅 기술을 활용하여 컴퓨팅 성능을 최대 150배까지 높이고 에너지 효율을 최대 42배까지 높이다.
다양한 부문의 선두 기업들은 가속화된 데이터 처리를 사용하여 획기적인 AI 이니셔티브를 주도하고 있다.
금융 조직이 단 몇 초 만에 사기를 탐지
금융 조직은 신속한 분석이 필요한 방대한 양의 트랜잭션 데이터로 인해 사기 패턴을 감지하는 데 상당한 어려움을 겪고 있다. 또한 실제 사기 사례에 대한 레이블이 지정된 데이터가 부족하여 AI 모델을 교육하는 데 어려움이 있다. 기존의 데이터 과학 파이프라인은 사기 탐지와 관련된 대용량 데이터를 처리하는 데 필요한 가속 기능이 부족한다. 이로 인해 처리 시간이 느려져 실시간 데이터 분석 및 사기 탐지 기능이 저해된다.
이러한 문제를 극복하기 위해 연간 80억 건 이상의 거래를 처리하는 아메리칸 익스프레스는 가속 컴퓨팅을 사용하여 LSTM(Long Short-Term Memory) 모델을 교육하고 배포한다. 이러한 모델은 순차적 분석 및 이상 징후 탐지에 탁월하며, 새로운 데이터에 적응하고 학습할 수 있어 사기 방지에 이상적이다.
American Express는 GPU에서 병렬 컴퓨팅 기술을 활용하여 LSTM 모델의 교육 속도를 크게 높인다. 또한 GPU를 사용하면 라이브 모델이 엄청난 양의 트랜잭션 데이터를 처리하여 고성능 계산을 수행하여 실시간으로 사기를 탐지할 수 있다.
이 시스템은 고객과 판매자를 더 잘 보호하기 위해 2밀리초의 지연 시간 내에 작동하여 CPU 기반 구성에 비해 50배 향상된 성능을 제공한다. 아메리칸 익스프레스는 가속화된 LSTM 심층 신경망을 기존 방식과 결합하여 특정 세그먼트에서 사기 탐지 정확도를 최대 6% 향상시켰다.
또한 금융 회사는 가속 컴퓨팅을 사용하여 데이터 처리 비용을 절감할 수 있다. PayPal은 NVIDIA GPU에서 데이터 사용량이 많은 Spark3 워크로드를 실행하여 빅데이터 처리 및 AI 애플리케이션에서 클라우드 비용을 최대 70%까지 절감할 수 있는 가능성을 확인했다.
데이터를 보다 효율적으로 처리함으로써 금융기관은 실시간으로 사기를 탐지할 수 있어 거래 흐름을 방해하지 않고 보다 빠른 의사결정이 가능하고 금융손실 위험을 최소화할 수 있다.
복잡한 라우팅 작업을 단순화하는 통신사
통신 제공업체는 네트워크 장치, 고객 상호 작용, 청구 시스템, 네트워크 성능 및 유지 관리 등 다양한 소스에서 막대한 양의 데이터를 생성한다.
매일 수백 페타바이트의 데이터를 처리하는 국가 네트워크를 관리하려면 서비스 제공을 보장하기 위해 복잡한 기술자 라우팅이 필요한다. 고급 라우팅 엔진은 기술자 파견을 최적화하기 위해 날씨, 기술자 기술, 고객 요청 및 함대 배포와 같은 요소를 고려하여 수조 개의 계산을 수행한다. 이러한 작업의 성공 여부는 꼼꼼한 데이터 준비와 충분한 컴퓨팅 능력에 달려 있다.
국내 최대 규모의 현장 파견 팀 중 하나를 운영하여 고객에게 서비스를 제공하고 있는 AT&T는 복잡한 차량 라우팅 문제를 계산하기 위해 휴리스틱, 메타 휴리스틱 및 최적화에 의존하는 NVIDIA cuOpt를 통해 데이터 중심의 라우팅 작업을 강화하고 있다.
초기 시험에서 cuOpt는 10초 만에 라우팅 솔루션을 제공하여 클라우드 비용을 90% 절감하고 기술자가 매일 더 많은 서비스 호출을 완료할 수 있도록 했다. NVIDIA RAPIDS는 데이터 과학 및 분석 파이프라인의 가속화를 가능하게 하는 소프트웨어 라이브러리 모음으로 cuOpt를 더욱 가속화하여 기업이 타부 검색과 같은 로컬 검색 휴리스틱과 메타 휴리스틱을 통합하여 지속적인 경로 최적화를 수행할 수 있도록 지원한다.
AT&T는 스파크 기반 AI 및 데이터 파이프라인의 성능을 향상시키기 위해 아파치 스파크에 엔비디아 래피즈 액셀러레이터(NVIDIA RAPIDS Accelerator)를 채택하고 있다. 이를 통해 회사는 AI 모델 교육부터 네트워크 품질 유지, 고객 이탈 감소 및 사기 탐지 개선에 이르기까지 모든 분야에서 운영 효율성을 높였다. AT&T는 RAPIDS Accelerator를 통해 타깃 워크로드에 대한 클라우드 컴퓨팅 지출을 줄이는 동시에 보다 빠른 성능을 구현하고 탄소 배출량을 줄이고 있다.
통신사들이 가능한 한 최고의 서비스 품질을 제공하면서 운영 효율성을 개선하고자 하기 때문에 데이터 파이프라인과 처리 속도를 높이는 것이 매우 중요할 것이다.