테이블 조인을 수행할 때 조인 단계별로 다른 조인기법 사용
1. NL JOIN
프로그래밍에서 사용하는 중첩된 반복문과 유사한 방식으로 조인 수행
결과를 가능한 빨리 화면에 보여주어야 하는 온라인 프로그램에 적당한 조인 기법
반복문 외부에 있는 테이블을 선행테이블 또는 외부테이블이라 하고 반복문 내부에 있는 테이블을 후행테이블 또는 내부테이블이라 함
FOR 선행 테이블 읽음 → 외부 테이블(Outer Table)
FOR 후행 테이블 읽음 → 내부 테이블(Inner Table)
(선행 테이블과 후행 테이블 조인)
먼저 선행테이블 조건 만족하는 행 추출하고 후행을 읽으면서 조인 수행, 선행테이블 조건만족하는 모든 행의 수만큼 반복 수행
따라서 만족하는 행수가 많으면 그만큼 후행 테이블 조건 작업 반복 수행
랜덤방식으로 데이터 액세스 하기에 처리 범위가 좁은 것이 유리
작업방식
- 선행 테이블에서 주어진 조건을 만족하는 행을 찾음 → 만족하지 않으면 해당 데이터는 필터링 됨
- 선행 테이블의 조인 키 값을 가지고 후행 테이블에서 조인 수행 → 선행테이블의 조인값이 후행에 존재하지 않으면 선행 테이블 데이터 필터링됨
- 선행 테이블의 조건을 만족하는 모든 행에 대해서 1번 작업 반복 수행 ← 인덱스에서 추출한 레코드 식별자를 이용하여 후행 액세스
2. Sort Merge JOIN
조인 칼럼을 기준으로 데이터를 정렬하여 조인 수행 NL JOIN이 랜덤으로 읽던 것의 단점을 개선함
단, 정렬할 데이터가 많아 메모리를 넘어 임시 영역을 사용하는 경우 성능 저하 발생 그래서 대량은 HASH JOIN 사용
비동등 조인 조건에서 작업 가능한 것이 장점(HASH JOIN은 동등만 가능)
인덱스를 사용하지 않기때문에 인덱스 미존재시 사용가능
정렬 작업이 미리 수행되있는 조인은 추가 정렬 작업이 이루어지지 않음
작업방식
- 선행 테이블에서 주어진 조건을 만족하는 행을 찾음
- 선행 테이블에의 조인 키를 기준으로 정렬 작업을 수행 → 조건을 만족하는 모든 행에 대해 반복 수행
- 후행 테이블에서 주어진 조건을 만족하는 행을 찾음
- 후행 테이블에의 조인 키를 기준으로 정렬 작업을 수행 → 조건을 만족하는 모든 행에 대해 반복 수행
- 정렬된 결과를 이용하여 조인을 수행, 성공하면 추출버퍼에 넣음
3. HASH JOIN
HASH 기법 이용하여 조인 수행
서로 동일한 해쉬 값을 갖는 것들 사이에서 실제 값이 같은지 비교하면서 조인 수행
NL조인의 랜덤 액세스 문제점과 Sort Merge JOIN의 정렬작업의 부담을 해결의 위해 등장
인덱스 존재 하지 않아도 사용 가능
동등 조건에서만 사용 가능
결과 행의 수가 적은 테이블을 선행테이블로 선정, 메모리 용량을 넘어서면 임시영역에 저장되기 때문에
그래서 선행 테이블을 Build Input, 후행테이블을 Prove Input으로 불림
작업방식
- 선행 테이블에서 주어진 조건을 만족하는 행을 찾음
- 선행 테이블의 조인 키를 기준으로 해쉬 함수를 적용하여 해쉬 테이블 생성 → 조인칼럼과 SELECT 절에서 필요로 하는 칼럼도 함께 저장됨
→ 반복수행
- 후행 테이블에서 주어진 조건을 만족하는 행을 찾음
- 후행 테이블의 조인 키를 기준으로 해쉬 함수를 적용하여 해방 버킷을 찾음 → 조인 키를 이용해서 실제 조인될 데이터를 찾음
- 조인에 성공하면 추출버퍼에 넣음
→ 후행 테이블의 조건을 만족하는 모든 행에 대해서 반복 수행
'자격증 공방 > SQLD' 카테고리의 다른 글
제 29회 SQLD 합격 후기 (4) | 2018.08.29 |
---|---|
별첨) SQL 정규화 방법 (0) | 2018.07.17 |
제 5-2절 인덱스 기본 (0) | 2018.07.17 |
제 5-1절 옵티마이저와 실행계획 (0) | 2018.07.17 |
제 4-8장 절차형 SQL (0) | 2018.07.11 |