본문 바로가기

Computer/0x0a 빅데이터

빅데이터(BigData)란 무엇인가?

빅데이터(BigData)란 무엇인가?




 IT 업계의 2가지 큰 이슈를 꼽으라면 '빅데이터' 와 '클라우드'를 손에 꼽는 사람들이 많습니다.

수년전부터 거론되고 있는 이 2가지 기술은 서로 닮아 있으며 중요합니다.


NIPA , Gartner ,한국 IDC, ETRI 10대 IT기술에 빠지지 않고 등장하는것이 바로 빅데이터 얘기입니다.

그렇다면 도대체 빅데이터(BigData)란 무엇일까요?




빅데이터란(BigData)?


- 빅데이터란, 데이터 소유와 규모의 경계를 넘어 사회적으로, 기업적으로 가치를 창출할 수 있는

잠재력을 가진 데이터와 그를 분석, 결과를 도출할 수 있는 정보화 기술력 입니다.


그러므로 빅데이터는 데이터의 규모 뿐만 아니라 가치 있는 정보추출 기술, 그리고 정보의

활용까지 전 과정을 의미하는 개념 입니다. 


빅데이터는 3V의 특성이 기존 데이터와의 구별을 가져 오지요.

지원,처리,분석,관리하기 위한 차별화된 기술이 요구 됩니다.


여기서 3V란?


1. Volume (규모의 증가)

: 기술적인 발전과 IT의 일상화가 진행되면서 해마다 디지털 정보량이 기하급수적으로 폭증

=> 제타바이트(ZB) 로의 진입


2. Variety (다양성의 증가)

: 로그기록, 소셜, 위치,소비, 현실 데이터 등 데이터 종류가 증가

- 텍스트 이외의 멀티미디어 등 비정형화된 데이터 유형의 증가


3. Velocity (속도의 증가)

: 사물정보(센서,모니터링), 스트리밍 정보 등 실시간성 정보증가

- 대규모 데이터 처리 및 가치 있는 현재정보(실시간) 활용을 위해 데이터 처리 및 분석 속도가 중요




과거와 현재의 빅데이터 비교


 

 과거

 현재

데이터 형태 

특정 양식에 맞춰 분류 

형식이 없고 다양함 

데이터 속도 

배치(batch) 

근실시간(near real-time) 

데이터 처리 목적 

과거 분석 

최적화 또는 예측 

데이터 처리 비용 

 국가ㆍ정부 수준 

개별 기업 수준  



- 예전에도 슈퍼컴퓨터를 이용하여 매우 큰 거대한 양의 데이터를 분석 해 왔습니다.

그러나 어마어마한 비용에 비해 효과가 떨어졌으며 정부에서나 할 수 있는 수준 이었지요.


최근의 빅데이터 시대에는 보다 저렴한 비용으로 매우 큰 데이터를 효과적으로 처리 할 수 있게 되었다는

것을 의미합니다. 오픈소스 기반의 하듑이라던지 이러한 기술이 뜨면서 매우 저렴하고 효율적으로 

정보를 추출하고 기존 정보와 통합해 가치를 전달할 수 있게 되었습니다.