본문 바로가기

기술 용어 검색

정규화

정의
- 다양한 유형의 데이터 값 검사를 통해 데이터 모델을 더 구조화시키고 개선시켜 나가는 절차에 관련된 이론

원칙
- 정보의 무손실 : 분해된 관계가 표현하는 정보는 분해전 정보를 모두 포함
- 데이터 중복성의 감소 : 중복으로 인한 이상현상 제거
- 분리의 원칙 : 하나의 독립된 관계성은 하나의 독립된 관계로 분리하여 표현
- 가역적 : 변경 후 다시 원상복구 할 수 있는 특성

이상현상
- 데이터의 중복성으로 인해 릴레이션을 조작할 때 발생하는 비합리적 현상
- 종류: 갱신이상, 삭제이상, 삽입이상

정규화의 종류
- 1차 정규화 (완전함수적종속성) : X->Y
- 2차 정규화(부분함수적종속성) : X->Y에서 Y가 X의 부분집함에 대해서도 함수적으로 종속되는 경우
- 3차 정규화(이행함수적 종속성) : 릴레이션 R에서 속성 A->X이고 X->Y이면 A->Y 인 경우
- BCNF(결정자 함수적 종속성) : 함수적 종속이 되는 결정자가 후보키가 아닌 경우, {학번,과목}->교수, 교수->과목인 경우
- 4차 정규화(다중값 종속성) : 한 관계에 둘 이상의 독립적 다중값 속성이 존재하는 경우, X,Y,Z 세개의 속성을 가진 릴레이션 R에서 속성 쌍(X,Z)값에 대응하는 Y값의 집합이 X값에만 종속되고 Z값에는 독립이면 Y는 X에 다중값 종속, X->>Y
- 5차 정규화(조인 종속성) : 관계 중에서 둘로 나눌 때는 원래의 관계로 회복 할 수 없으나, 셋 또는 그 이상으로 분리시킬 때 원래의 관계를 회복할 수 있는 특수한 경우

정규화 테이블의 반정규화 검토 대상
- 자주 사용하는 테이블에 접근하는 프로세스 수가 많고 일정범위만을 조회하는 경우
- 테이블에 대량의 데이터가 있고, 대량의 데이터 범위를 처리하는 경우에 처리범위를 줄이지 않으면 성능에 영향을 줄 경우
- 통계성 프로세스에 의해 통계정보를 필요로 할때 별도의 통계테이블(반정규화 테이블)을 생성 검토
- 테이블에 많은 조인이 걸려 데이터를 조회하는 작업이 기술적으로 어려울 경우 검토

'기술 용어 검색' 카테고리의 다른 글

B+ Tree  (0) 2007.12.08
Multimedia DB  (0) 2007.12.08
동시성제어  (0) 2007.12.08