[디지털비즈온 송민경 기자] 인공 지능은 이전에는 인간이 독점적으로 수행했던 비수동 작업을 자동화시킬 정도로 발전 속도가 빠르다. 최근 로봇으로 곧 대체될 수 있는 직업 목록에 소프트웨어 개발자가 추가됐다.
피터 틸(Peter Thiel)의 파운더스 펀드(Founders Fund)와 전 트위터 임원 엘라드 길(Elad Gil), 도어대시(Doordash)의 공동 창업자 토니 수(Tony Xu) 등 기술 업계 리더들이 최근 설립한 AI 스타트업 코그니션 랩스(Cognition Labs)는 12일(현지기간) 자율형 AI 소프트웨어 엔지니어 ‘데빈(Devin)’을 공개했다.
세계 최초의 AI 소프트웨어 엔지니어인 데빈은 단 한 번의 프롬프트로 코드를 작성하고, 웹 사이트 및 소프트웨어를 만들 수 있어 엔지니어를 지원하고 작업을 더 쉽게 만들기 위한 도구라고 밝혀 인디아투데이, 벤처비트 등 외신에서 보도했다.
벤처비트는 데빈이 깃허브와 MS의 코파일럿(Copilot)과 같은 코딩 도구를 한 단계 더 발전시켜 코드 작성과 관련 버그 수정 및 실행 등 전반적인 개발 프로젝트를 스스로 수행할 수 있는 능력을 갖췄다고 보도했다.
코그니션 CEO 스캇 우(Scott Wu)는 코딩 프로젝트 및 데이터 연구 작업을 완료하기 위해 다양한 단계를 거치는 동안 데빈이 사용자가 AI 도구의 명령줄, 코드 편집기 및 워크플로를 볼 수 있는 방법을 동영상을 통해 공개했다.
데빈은 요청을 받으면 인터넷에서 교육 자료를 샅샅이 뒤져 작업을 완료하는 방법을 배우고 엔지니어링 프로세스 중에 발생하는 자체 문제를 디버깅할 수 있으며, 사용자가 원하는 경우 중간에 개입도 가능하다고 밝혔다.
코그니션 측은 트위터(X)를 통해 "오늘 우리는 최초의 AI 소프트웨어 엔지니어인 데빈을 소개하게 되어 기쁩니다. 데빈은 SWE-Bench 코딩 벤치마크의 새로운 최첨단이며, 선도적인 AI 회사의 실제 엔지니어링 인터뷰를 성공적으로 통과했으며, Upwork에서 실제 작업도 완료했습니다. 데빈은 자체 셸, 코드 편집기 및 웹 브라우저를 사용하여 엔지니어링 작업을 해결하는 자율 에이전트입니다." 라고 밝혔다.
SWE-Bench 성능 관련하여 데빈은 SWE-Bench 코딩 벤치마크에서 다른 모델을 능가한다고 언급했다. 실제 깃허브(GitHub) 이슈를 해결할 때 데빈은 13.86%의 이슈를 추가 보조 없이 정확하게 해결했으며, 이는 이전 최첨단 모델의 1.96% 보조 없이 해결한 성능과 4.80% 보조로 해결한 성능보다 훨씬 우수하다고 공개했다.
코그니션의 발표에 따르면 AI의 기능 목록에는 새로운 기술 사용 학습, 애플리케이션 엔드 투 엔드 생성 및 배포, 코드베이스의 버그 감지 및 수정, 기존 프로덕션 리포지토리에 기여, 가장 불안한 것은 자체 AI 모델 훈련 및 세부 조정이 필요하다고 밝혔다. 조정을 통해자체 재프로그래밍으로 이어질 수 있는지, 그리고 실제 스카이넷이나 GLaDOS의 출현으로 이어질 수 있을지는 현재로서는 미지수라고 밝혔다.