[빅데이터로 보는 뉴스] '네이버 데이터 랩'으로 돌려보니 영화 흥행 순위는 검색어 순위에 비례한다

2016-02-21 01:04:00

영화 흥행 순위는 검색어 순위에 비례하는 것으로 나타났다.
본지에서는 영화 흥행순위와 검색어와의 상관관계를 분석해 보기로 했다.
2015년 영화흥행순위는 영화진흥위원회의 통합전산망 기간별 박스오피스 데이터를 활용했고 검색어 순위는 '네이버 데이터 랩'으로 검색빈도를 이용했다.
2015년 흥행 결산 뉴스에 빠지지 않는 것이 ‘천만영화’ 혹은 흥행 순위 기록이다. 천만 관객을 넘은 영화는 3개의 영화였다. <베테랑>,<암살> 그리고 <어벤져스>였다.
<베테랑>이 1341만 4009명으로 1위, 뒤를 이어 <암살> 1270만 5700명, <어벤져스: 에이지 오브 울트론> 1049만 4499명, <국제시장> 891만 5904명(누적 1426만 1582명) 순이었다.
[빅데이터로 보는 뉴스] '네이버 데이터 랩'으로 돌려보니 영화 흥행 순위는 검색어 순위에 비례한다
▲ 네이버 데이터 랩으로 분석한 검색어 빈도 (자료=네이버 데이터 랩)

다음으로 '네이버 데이터 랩'에서 2015년 상위 영화 3편의 이름으로 1년간 검색추이를 살펴봤다.
영화 <베테랑>이 월등히 많았고, 다음으로 암살과 어벤져스 순으로 나타났다. 검색어 순위가 높을 수록 영화 흥행 순위가 높다고 일반화 시킬 수 없겠지만 영화 <베테랑>의 검색어 활용량은 꾸준하였다.
◆ 네이버, 10여년간 쌓은 데이터 빅데이터 포털 개설
네이버가 지난 10여년간 쌓은 데이터를 이용자들이 활용할 수 있도록 빅데이터 포털을 개설했다.
네이버는 이용자들이 네이버 등 민간기업과 공공기관이 보유한 데이터를 활용할 수 있도록 하는 빅데이터 포털, 데이터랩(http://datalab.naver.com/)의 베타 버전을 지난달 14일 오픈했다.
네이버 데이터 랩은 이용자들이 다양한 민간 및 공공 데이터를 한눈에 볼 수 있고, 더 나아가 이를 자신이 보유한 데이터에 융합해 다방면으로 활용할 수 있다는 점이 특징이다. 사업이나 창업을 계획하는 이들에게 유용한 정보들이 많다는 평가다.
[빅데이터로 보는 뉴스] '네이버 데이터 랩'으로 돌려보니 영화 흥행 순위는 검색어 순위에 비례한다
▲ 사진=네이버 데이터 랩

데이터 랩은 크게 ▲네이버 검색 데이터를 개인 이용자가 보유한 데이터와 융합 분석할 수 있는 '데이터 융합 분석' ▲위치정보를 기반으로 지역별 특정 분야의 데이터를 시각적으로 보여주는 '지역 통계' ▲현재 인기 검색어들의 기간별 트렌드를 파악할 수 있는 '검색어로 알아보는 대한민국' 섹션 등으로 구성돼 있다.

데이터 융합 분석 섹션에서는 개별 이용자가 가진 데이터를 네이버 검색 데이터에 융합해 분석하는 기능을 최초로 제공한다. 개인이나 사업자가 보유한 거래내역 등의 데이터를 네이버의 검색어 데이터와 비교해 볼 수 있다.

실제로, 의류 쇼핑몰 관련 업체 S사는 데이터 랩의 테스트 버전을 통해 특정 상품의 구매기간을 예측하고, 재고 확보 및 온라인 판매 적정시기 등에 대한 주요 데이터를 얻기도 했다고 네이버는 설명했다.

이 회사는 니트 상품의 경우, 검색 및 판매 기간이 다른 겨울 상품 대비 길게 이어지는 점을 파악해 재고 확보 및 온라인 판매시기를 기존보다 한 달 정도 앞당기는 등 상품의 특성에 맞춘 적절한 판매 계획을 세울 수 있었다.

융합 분석된 빅데이터는 다른 이용자와도 공유할 수 있다. 네이버 측은 "빅데이터란 단순히 데이터의 크기가 아닌 데이터가 제공하는 가치의 크기"라며 "데이터 랩은 서로 다른 데이터의 융합을 통해 새로운 가치를 제공하기 위해 만들어진 공간"이라고 설명했다.

네이버 등 민간기업에서 제공하는 정보와 공공 데이터를 시각적으로 결합한 데이터도 확인할 수 있다. '지역통계' 섹션에서는 네이버 지역 서비스에 등록된 업체 정보와 해당 지역 내 모바일 검색 사용자 수를 비교해 업종별 분포도를 네이버 지도상에서 시각화한 빅데이터를 제공한다.

또한, 공공기관이 제공하는 데이터도 네이버 지도에 융합되어 제공된다. 현재 데이터 랩에서는 국토교통부가 제공하는 '실거래가 공개시스템'을 연계하고 있다. 이를 통해, 이용자들은 읍/면/동 단위로 세분화된 아파트 실제 매매 가격과 전세, 월세 거래량 등을 네이버 지도상에서 확인할 수 있다.

'검색어로 알아보는 대한민국' 섹션에서는 2007년부터 현재까지 각 분야별, 이용자 라이프스타일에 따라 분류한 10여 년간의 인기 검색어 데이터를 제공한다.

이용자는 관심 있는 검색어에 대해 최소 3개월에서 최대 10년까지의 변화 추세를 확인할 수 있으며, 설정한 기간 내 해당 검색어의 최대 검색량을 100으로 산출한 상대적 수치가 제공된다.

예를 들어, 현재 공연 분야의 인기 검색어에 오른 특정 뮤지컬이 최근 3개월 내에 얼마나 많이 검색됐는지 그래프 형태로 보여주는 방식이다.

이외에도 데이터 랩에서 통계청, 공공데이터포털 등이 제공하는 13만 건 이상의 공공 데이터도 정리돼 있다. 네이버는 다양한 기관들과의 꾸준한 협력을 통해 공공 데이터를 지속적으로 확보해나갈 계획이라고 밝혔다.

윤영찬 네이버 부사장은 "중소상공인 및 창업자들에게 전문성 있고, 신뢰도 높은 정보를 제공하기 위해선 정부, 공공기관, 민간과 지속적인 협력이 필요하며 이를 적극적으로 추진할 빅데이터 가버넌스도 필요할 것"이라고 말했다.

<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>