본문 바로가기

기술 용어 검색

데이터 마이닝

1. 데이터마이닝 정의
- 대용량의 데이터로부터 이들 데이터에 존재하는 관계, 패턴,규칙 등을 탐색하고 찾아내어
모형화 함으로써 유용한 지식을 추출하는 일련의 과정들

2. 데이터마이닝의 특징
- 대용량의 관측 가능한 자료를 다룸
- 컴퓨터 중심적 기법
- 경험적 방법에 근거하고 있음

3. 데이터 마이닝 과정

단계 내용
Sampling/selecting 데이터 추출
Data cleaning 데이터 무결성 및 질 관리
Exploration/Transformation 이미 알고있는 사실들을 확인하여 수치화 하는 작업을 시작으로 하여 보유하고 있는 수많은 변수들의 관계를 살펴보는 단계
Modeling 다양한 모형을 접함
Reporting/visualization 보기편하고 이해하기 쉬운 형태로 제공

4. 데이터 마이닝 기법

기법 개념
군집방법 - 상호간에 유사한 특성을 갖는 데이터들을 묶어 전체 윤곽 파악
- 다른 분석을 위한 사전 단계 작업
의사결정 트리 분류/예측 모두 사용 가능하며, 분석의 정확도 보다 분석과정 설명이 필요한 경우 유용하게 사용함
연관 규칙 트랜잭션 중에서 동시에 발생하는 트랜잭션의 연관 관계를 발견하는 기법
연속 규칙 연관 규칙 트랜잭션 이력 데이터를 시계열적으로 분석하여 트랜잭션의 향후 발생 가능성을 예측하는 기법
신경망 대용량 데이터로부터 결과 변수에 대한 예측이나 분류를 목적으로 감춰진 패턴을 찾고 일반화 하는데 유용

5. OLAP과의 비교

기능(특징) OLAP Data Mining
정보요구 유도 방안 전사적으로 무슨일이 발생? 왜 이런 일이 발생했는가를 기반으로 미래예측
데이터 구체화 정도 요약 데이터 상세한 트랜잭션 수준의 데이터
분석 접근 방법 사용자 주도, 대화식 분석 데이터 주도 자동 지식 발견
분석 기법 다차원적, 드릴다운 데이터 준비(정제), 마이닝룰 적용, 패턴발견, 예측, 적용

'기술 용어 검색' 카테고리의 다른 글

OR Mapping  (0) 2007.12.08
DB병행제어  (0) 2007.12.08
MMDB (Main Memory Database)  (0) 2007.12.08