[LG경제연구원] 빅데이터의 현실, 기대와 큰 격차
| 등록자 | 관리자 | 등록일 | 2015-05-27 |
|---|---|---|---|
| 첨부파일 | |||
빅데이터의 현실, 기대와 큰 격차
가용한 데이터 분석으로 성과 거둔 사례들
김민희 책임연구원 mhkim0325@lgeri.com
<목차>
1. 기대에 비해 더딘 진행
2. 빅데이터 활용을 어렵게 하는 요인들
3. 가용한 데이터부터
빅데이터가 미래 세상을 바꿀 주요 동인으로 주목받고 있고 향후 시장이 크게 성장할 것으로 기대되고 있지만, 아직 현실적으로는 많은 기업들이 빅데이터를 활용하는데 어려움을 겪고 있다. 데이터 확보의 문제, 정보보호 및 보안의 문제, 예산 문제, 분석 역량 및 전문가 부족 문제 등이 빅데이터 활용을 어렵게 하는 요인들이다. 외부 데이터는 고사하고 기업 내부 데이터들도 파편화되어 통합되어 있지 않은 경우가 많다. 또한 필요한 외부 데이터가 있어도 확보하기 어려운 경우가 많다. 이미지, 텍스트, 동영상 등 비정형 데이터들은 확보하기도 어렵지만 의미 있는 결과를 얻을 수 있을 정도로 기술 수준도 충분히 발달하지 못하였다. 특히 영어에 비해 한글 텍스트 분석은 더 어렵고 갈 길이 멀다. 개인정보보호에 따른 리스크도 크다. 개인정보는 특정 개인을 식별할 수 없도록 하는 비식별화 조치를 취한 후에 이용할 수 있지만, 비식별화가 생각보다 쉽지 않다. 수집되는 데이터 소스가 다양해지고 데이터 마이닝 등 분석 기법이 정교해지면서 개인정보의 비식별화는 점점 더 어려워지고 있다. 데이터 과학자에 대한 수요는 급증하고 있는 반면 공급이 수요를 따라가지 못하면서, 빅데이터 관련 인력 수급의 불균형 또한 장애 요인이 되고 있다.
빅데이터를 활용하는데 어려움이 있지만, 가용하기 비교적 쉬운 데이터 분석으로 접근하여 오히려 성과를 내고 있는 사례들도 많다. 코노코필립스, 유나이티드 헬스케어, 클라이밋 코퍼레이션 등은 기업 내부 데이터나 외부 공개 데이터 같이 비교적 손쉽게 얻을 수 있는 데이터를 가지고 의미 있는 결과를 도출하였다. 그리고 제스트파이낸스와 트립어드바이저는 다양한 비정형 데이터를 활용한 사례이다. 비정형 데이터가 처리, 정제 및 분석 기술의 한계 때문에 분석하는 것이 어렵지만 분석의 대상을 잘 디자인 할 경우 적지 않은 성과를 낼 수 있음을 보여주는 사례들이다. 아직은 복잡하고 정제되지 않은 데이터로부터 신호와 노이즈를 구분해 내기가 어렵지만 선별과 정제 과정을 거치면서 분석 역량을 높여가는 것이 당장의 성과뿐 아니라 미래를 위한 역량 축적을 위해서도 필요한 과정으로 보인다.
※ 자세한 사항은 원문 참조
출처 : LG경제연구원
원문URL : http://www.lgeri.com/industry/general/article.asp?grouping=01030100&seq=248&srchtype=0&srchword=





