본문 바로가기

쉽게 풀어본 IT 기술

빅데이터의 실제적인 이야기

데이터가 많다고 해서 빅데이터라는 말로 만들어졌을 것이다. 데이터가 기존에는 필요한 정보들 위주로 저장이 되어서 사용되었다. 사용자 정보라고 하면 언제 태어났고, 어디 살고 있고, 취미가 무엇인지 정도 이것을 가지고, CRM이라고 고객 관리 데이터로 사용을 했다.

데이터베이스는 정형화된 틀 속에 값을 넣고, 그 값이 틀림이 없게 관리하는 것이 기존 데이터베이스의 역할이였을 것이다. 빅데이터는 그 사람의 정보뿐 아니라 그 사람의 행동까지도 기록한다로 생각하면 된다. 그 사람이 하는 행위도 다 기록에 남는다. 그 사람이 무엇을 샀고, 어디로 갔고, 무엇을 먹었는지 사실 과거에 불필요하다고 생각했던 데이터들 또는 데이터베이스에서 구지 관리하지 않았던 시계열(시계열은 시간축을 X로 하여 흘러가는 데이터들) 의 데이터도 저장을 한다. 그러한 많은 데이터 속에서 의미 있는 데이터를 추출할 수 있다는 의미이다.

두가지 예를 들어보면 옷매장이 있고, 범죄 발생 장소와 시간의 얘기이다. 단순하게 접근을 하면 옷 매장에서 계절마다 잘팔리는 옷이 있다. 매장 관리를 오랬동안 해본 사람이라면 경험을 통해서 알 수 있다. 하지만 사람의 경험이라는 것은 그 사람에게만 축적된 데이터이기도 하고, 부정확함을 가진다. 좀더 정확하게 분석할 수 있다면 신뢰도를 높일 수 있을 것이다. 그렇다면 옷의 종류별 판매량을 계절별로 데이터화 할 수 있을 것이다. 그리고 이정도는 매장의 판매 대장에 있지 않느냐고 얘기할 수 있지만, 과거 데이터베이스는 판매 정보에 대한 기록, 매출 관리와 같은 차원의 의미로 저장관리했을 것이다.

빅데이터의 근본적인 목적은 과거의 데이터를 통한 앞으로의 예측에 있다. 그리고 개인별 데이터를 통한 맞춤형 추천 같은 것에 있다. 물론 이 두개 정도도 빅데이터의 효과의 일부겠지만, 이해하기 쉬운 예이다. 그래서 판매량의 경우 계절별 분석을 해본다. 여기에 예측을 적용한다면 어떤 옷을 조금 더 많이 준비할지 예측이 가능하다. 그렇다면 제고 문제에서 약간은 효율적으로 관리할 수 있게 된다. 그리고 그 어떤 옷을 언제 할인 하면 좋을지도 사람의 느낌이지만, 데이터 분석을 통해서 효과적인 전략을 세워볼수가 있다.

그리고 범죄 관련해서는 뉴욕에서 범죄가 일어나는 장소와 시간을 데이터화 한다.
과거는 사건이 어디서 있었다는 것으로 기록을 하는 것이지 미래를 위한 대비는 아니였을 것이다. 그런데, 범죄가 일어나는 장소와 시간을 오랜 기간동안 분석을 해보니 예측이 가능하다라는 것이다. 그래서 그 예측기반으로 장소와 시간에 순찰을 하였다. 그랬을 때 실제 범죄가 일어나려는 장면도 포착이 된 적이 있고, 범죄율이 감소했다는 것이다. 이것이 사실이라고 하는데, 정말 사실일 수도 있고, 아닐 수도 있다. 이 가능성을 생각해보는 자체가 빅데이터이다.

빅데이터가 처음부터 답을 주는 것은 아니다. 빅데이터는 데이터를 종합해서 분석을 해보자는 것이지. 기존 데이터베이스에서 데이터를 저장하기 위한 것의 의미는 아니다. 그래서 현실적으로 보면 빅데이터 도입에 대해서 회의적인 회사들도 있다. 왜냐면 실질적인 투자 대비 효과가 안보일 수도 있기 때문이다. 그러면 빅데이터가 과연 뜬구름일까를 보면 이미 뉴스에서도 빅데이터 데이터 분석을 통한 예측이라든가 사람들의 심리 분석에도 동원이 되고 있다. 가치는 있는데, 어떻게 쓰느냐 어떻게 활용을 하느냐가 관건일 것이다.


책처럼 전체를 보기를 원하시면 아래 링크를 클릭하시고 북마크 하셔서 보시면 편리합니다. 

https://wikidocs.net/22393

 

폰으로 자주 보시면 편리하게 앱으로 다운 받으세요.


안드로이드앱 다운로드

https://play.google.com/store/apps/details?id=com.hitouch.wikibook

'쉽게 풀어본 IT 기술 ' 카테고리의 다른 글

인공지능 vs 머신러닝  (0) 2018.09.01
DHCP는 편리하다.  (0) 2018.09.01
압축의 원리 간단하게  (0) 2018.09.01