[4차산업 빅데이터㊷] “빅데이터”… 일상 생활 속 삶의 변화와 활용

스마트폰 보급, 4차산업혁명 시대가 도래로 데이터 수집이 가속 일상 생활의 자취나 정보가 모두 빅데이터 우리가 소비하는 콘텐츠 데이터로부터 트렌드와 변화를 측정 새로운 부가가치를 위한 데이터 공유・거래 프레임워크 설정 필요

2022-12-15     김맹근 기자
사진 : pixabay

[디지털비즈온 김맹근 기자] 한 세기 전에 석유가 꿈을 실현해 주었듯이 데이터는 오늘날 경제적 및 기술적 혁신의 비전을 이끌고 있다. “원유”와도 같은 데이터를 추출하고, 정제하고, 실시간으로 결정에 영향을 줄 수 있는 곳에 연결할 수 있다면 그 가치는 급상승할 것이다. 분석을 통해 주요 정보를 확보하여 복잡한 행태, 패턴 및 이벤트를 발생하는 즉시 혹은 더 나아가 아예 발생하기 전에 알아낼 수 있다면 데이터가 그 고유의 가치를 실현하게 되는 것이다.

우리는 빅데이터라는 단어를 이해하고 사용하는 익숙한 단어가 되었다. 이 친숙함은 실제 빅데이터를 접하거나 다룬 경험에서 비롯되기보다는 많은 곳에서 ‘빅데이터’라는 단어 자체를 노출하는 횟수가 많아졌기 때문이다. 실제로 데이터 관련 직무가 아닌 경우 빅데이터의 실체나 내용을 직접 보거나 접하는 일은 드물다. 그렇다면 빅데이터는 왜 이렇게 자주 언급되기 시작했을까?.

정보화 시대라는 표현에서 그 ‘정보’는 데이터를 의미하다 보니 이때부터 데이터의 중요성이 크게 부각되었다. 그리고 스마트폰의 보급, 4차산업혁명의 시대가 도래하면서 데이터 수집이 가속화되고 활용 방법도 발전하고 있다. 이렇게 수집된 데이터의 양은 방대하고, 숫자를 비롯하여 문자나 영상 등 데이터의 종류도 다양하다. 우리는 이러한 데이터를 빅데이터라고 부른다.

그리고 이러한 빅데이터는 많은 부분 우리들의 일상생활 속에서 수집된다. 포털사이트에서 검색할 때 노출되는 블로그나 카페 글, 온라인 뉴스 글, 스마트폰에 저장된 영상과 사진, SNS에서 남긴 많은 대화 등 일상 생활의 자취나 정보가 모두 빅데이터이다. 개인이 남기는 데이터가 모여 빅데이터가 되기도 하고, 여러 사람의 자취가 모아져 빅데이터가 되기도 한다. 예를 들어 고속도로의 통행량이나 CCTV 자료, 대형 마트의 매출 데이터 등 그 종류도 다양하다.

최근에는 좀더 개인화된 빅데이터에 집중하는 경향이 있다. 여러 개인의 집계 데이터는 활용하기에 한계가 있어 한 개인이 남기는 여러 데이터를 연결하는 방법과 그 활용에 많은 기술과 전문성이 현재 가장 뜨거운 관심이다.

특히 스마트폰의 보급으로 인해 앱(애플리케이션) 활용이 많아지면서 개인화 빅데이터 수집과 분석에 대한 비즈니스 분야에서의 니즈(needs)가 높아지고 있다. 개인이 남긴 다량의 데이터를 분석하여 타겟 광고나 비즈니스 전략에 활용하기도 하며, 구매할 상품을 미리 예측하여 추천하거나 단골 고객이 될 가능성도 계산할 수 있다. 우리가 웹이나 앱에서 접하는 많은 광고들은 빅데이터 분석 결과의 산물일 수 있다.

빅데이터와 스몰데이터는 빅데이터가 처음 관심을 많이 받았던 때에는 스몰데이터가 전통적인 데이터 접근 또는 활용 방식이고 빅데이터를 활용하는 것이 최신의 기술인 것으로 인식되었다. 그러나 최근에 초 개인화, 초 지능 등 빅데이터 분야에서도 개인화 바람이 불고 있어 스몰데이터의 접근 방식이 다시 중요하게 거론되고 있다.

사실 빅데이터와 스몰데이터 모두 하나의 데이터 내에 속하며, 어떻게 접근하고 무엇을 분석할 것인가의 차이일 뿐 활용하는 데이터 자체가 다른 것은 아니다. 그리고 보다 정확하게는 데이터를 ‘잘’ 활용하기 위해서는 빅데이터와 스몰데이터 접근 방식이 모두 필요하다는 것이다.

엔터테인먼트 앱 분석 사례는 개인화된 데이터의 특성은 단순하게 방대한 양의 데이터가 수집되거나 집계된 것이 아니라 개인의 생활습관이나 행동패턴이 담겨 있다는 것이다. 이러한 특성은 자신도 모르게 노출되는 것이 대부분으로 실제 그 데이터의 당사자인 개인들도 인식하지 못하고 있는 경우가 많다.

빅데이터와 스몰데이터를 모두 활용한 분석결과는 앱 삭제를 하는 사용자들이 주말에는 잘 방문하지 않고, 앱 설치 후 3일까지는 잦은 방문을 하는 반면, 콘텐츠 탐색의 범위가 좁다는 것을 알려 주었다. 특히 스몰데이터 분석에서는 추천된 콘텐츠와 사용자의 선호도와의 일치 정도가 매출에 영향을 주고, 매출이 높은 사용자 사이에서도 마니아와 다양한 취향을 가지는 두 그룹으로 구분됨을 확인할 수 있었다.

사실 우리가 앱을 사용하면서 사용 빈도나 사용시간은 스스로 체크가 가능할 수 있지만 나의 취향이 다양한지 또는 로열티 고객인지 아닌지는(멤버십이 없다면) 자기 기록이 아닌 다른 사용자와의 비교를 통해야 알 수 있다. 흥미로운 것은 우리가 소비하는 콘텐츠 데이터로부터 트렌드와 변화를 측정할 수 있다는 점이다.

콘텐츠 소비와 빅데이터는 디지털 콘텐츠가 없던 과거에 취미를 답해야 하는 상황에서는 독서나 음악감상 등 정해진 보기 중 적당히 해본 적 있는 취미를 선택해야 했다. 사실 보기에 없는 취미가 많고, 정말 즐기는 것이 무엇인지(뭐가 취미인지) 고민해 본 적이 많지 않을 것이다.

시간과 정성을 많이 들이고, 사람들이 공감할 수 있을 정도로 알려진 것만이 취미에 포함되는 것은 아니다. 마찬가지로 디지털 콘텐츠 소비가 쉽게 이용할 수 있고 종류가 다양하다고 해서 시간을 때우는 데에 주로 이용되는 것도 아니다.

이러한 경향이 보편적일 수는 있지만 특정 앱 내에서 개인이 남기는 콘텐츠 소비 데이터로부터 취미로 활용하는 사용자와 그렇지 않은 사용자를 구분할 수 있다는 점을 강조하고자 한다. 동영상을 공유하는 플랫폼인 유튜브(YouTube)에서 유튜브 크리에이터 라는 직업이 생긴 것처럼 지금의 디지털 콘텐츠 소비가 어떤 특성을 가지고 있고 변화를 가져올지에 대한 답은 개인이 남긴 빅 데이터에 있다.

결론적으로 개인 데이터 활용을 위한 새로운 대안은 개인적 데이터 생태계의 복잡성, 변화의 속도, 잠재적 가치와 변화하는 개인의 역할을 고려하여 유연한 접근방법 필요하다. 데이터는 자체적으로 가치를 창출하거나 문제를 초래하는 것이 아니라 데이터의 사용이 가치를 창출하거나 문제를 초래한다.

개인 데이터 자체에 대한 보호의 초점으로부터 데이터 사용에 초점을 맞추도록 사고의 전환 필요하다. 개인 데이터의 통제권을 데이터 주체에게 부여함으로써 개인의 프라이버시 문제를 해결하고 새로운 부가가치 창출할 수 있다.

따라서 개인 데이터의 안전한 흐름을 보장하면서, 새로운 부가가치를 창출할 수 있도록 데이터 공유・거래 프레임워크 설정하여야 한다. 개인정보의 보호에 초점을 두고 있는 현행 개인정보보호 법제 검토 및 개선을 통해 개인정보의 적정한 이용 보장이 해결되어야 한다. 또한 국제적 프라이버시 상호운용성 보장과 개인 데이터 활용을 위한 협력관계를 구축해야 한다.