1. 데이터마이닝 정의
- 대용량의 데이터로부터 이들 데이터에 존재하는 관계, 패턴,규칙 등을 탐색하고 찾아내어
모형화 함으로써 유용한 지식을 추출하는 일련의 과정들
2. 데이터마이닝의 특징
- 대용량의 관측 가능한 자료를 다룸
- 컴퓨터 중심적 기법
- 경험적 방법에 근거하고 있음
3. 데이터 마이닝 과정
단계 | 내용 |
Sampling/selecting | 데이터 추출 |
Data cleaning | 데이터 무결성 및 질 관리 |
Exploration/Transformation | 이미 알고있는 사실들을 확인하여 수치화 하는 작업을 시작으로 하여 보유하고 있는 수많은 변수들의 관계를 살펴보는 단계 |
Modeling | 다양한 모형을 접함 |
Reporting/visualization | 보기편하고 이해하기 쉬운 형태로 제공 |
4. 데이터 마이닝 기법
기법 | 개념 |
군집방법 | - 상호간에 유사한 특성을 갖는 데이터들을 묶어 전체 윤곽 파악 - 다른 분석을 위한 사전 단계 작업 |
의사결정 트리 | 분류/예측 모두 사용 가능하며, 분석의 정확도 보다 분석과정 설명이 필요한 경우 유용하게 사용함 |
연관 규칙 | 트랜잭션 중에서 동시에 발생하는 트랜잭션의 연관 관계를 발견하는 기법 |
연속 규칙 | 연관 규칙 트랜잭션 이력 데이터를 시계열적으로 분석하여 트랜잭션의 향후 발생 가능성을 예측하는 기법 |
신경망 | 대용량 데이터로부터 결과 변수에 대한 예측이나 분류를 목적으로 감춰진 패턴을 찾고 일반화 하는데 유용 |
5. OLAP과의 비교
기능(특징) | OLAP | Data Mining |
정보요구 유도 방안 | 전사적으로 무슨일이 발생? | 왜 이런 일이 발생했는가를 기반으로 미래예측 |
데이터 구체화 정도 | 요약 데이터 | 상세한 트랜잭션 수준의 데이터 |
분석 접근 방법 | 사용자 주도, 대화식 분석 | 데이터 주도 자동 지식 발견 |
분석 기법 | 다차원적, 드릴다운 | 데이터 준비(정제), 마이닝룰 적용, 패턴발견, 예측, 적용 |
'기술 용어 검색' 카테고리의 다른 글
OR Mapping (0) | 2007.12.08 |
---|---|
DB병행제어 (0) | 2007.12.08 |
MMDB (Main Memory Database) (0) | 2007.12.08 |