영우 글로벌 러닝 4차혁명 교육과정의 "방형욱" 강사님과 함께 공부한 내용입니다.

# Rollup

- 컬럼의 개수가 n개면 n+1 가지 종류의 결과 생성

- 컬럼의 나열 순서가 중요함

select deptno, job, sum(sal)

from emp

group by deptno, job

select deptno, job, sum(sal)

from emp

group by ROLLUP(deptno, job);

select deptno, job, sum(sal)

from emp

group by GROUPING SETS((deptno, job), (deptno), ());

cf. select deptno, decode(deptno, null, 'TOTAL', decode(job, null, 'DEPT_SUM', job)) as job, sum(sal)

from emp

group by ROLLUP(deptno, job);

# Cube

- 컬럼의 개수가 n개면 2^n 가지 종류의 결과 생성

- 컬럼의 나열 순서가 중요하지 않음

select deptno, job, sum(sal)

from emp

group by CUBE(deptno, job);

select deptno, job, sum(sal)

from emp

group by GROUPING SETS((deptno, job), (deptno), (job), ());

# 집계 기준 컬럼이 3개일 경우

drop table emp2 purge;

create table emp2

as

select empno, ename, sal, job, deptno, decode(mod(empno, 2), 0, 'M', 'W') as gender

from emp e

union all

select empno, ename, sal+100, job, deptno, decode(mod(empno, 2), 0, 'W', 'M') as gender

from emp e;

select * from emp2;

--

select deptno, job, gender, sum(sal)

from emp2

group by ROLLUP(deptno, job, gender)

order by 1, 2, 3;

select deptno, job, gender, sum(sal)

from emp2

group by GROUPING SETS((deptno, job, gender), (deptno, job), (deptno), ())

order by 1, 2, 3;

--

select deptno, job, gender, sum(sal)

from emp2

group by CUBE(deptno, job, gender)

order by 1, 2, 3;

select deptno, job, gender, sum(sal)

from emp2

group by GROUPING SETS((deptno, job, gender), (deptno, job), (deptno, gender), (job, gender), (deptno), (job), (gender), ())

order by 1, 2, 3;

select deptno, job, gender, sum(sal)

from emp2

group by GROUPING SETS((deptno, job, gender), (job, gender), ())

order by 1, 2, 3;

# GROUPING 함수

drop table emp3 purge;

create table emp3 as select * from emp;

update emp3 set job = null where rownum = 1;

select * from emp3;

=> grouping 함수를 사용하지 않을 경우 아래와 같이 질의 결과가 이상해집니다.

select deptno, job, sum(sal) as sum_sal

from emp3

group by ROLLUP(deptno, job);

select *

from (select deptno, job, sum(sal) as sum_sal

from emp3

group by ROLLUP(deptno, job))

where deptno is not null

and job is null;

=> grouping 함수를 사용하면 이렇게 달라집니다.

select deptno, job, sum(sal) as sum_sal,

grouping(deptno) as g_deptno,

grouping(job) as g_job

from emp3

group by ROLLUP(deptno, job);

select deptno, job, sum_sal

from (select deptno, job, sum(sal) as sum_sal,

grouping(deptno) as g_deptno,

grouping(job) as g_job

from emp3

group by ROLLUP(deptno, job))

where g_deptno = 0

and g_job = 1;

select deptno, job, sum_sal

from (select deptno, job, sum(sal) as sum_sal,

grouping(deptno) as g_deptno,

grouping(job) as g_job

from emp3

group by ROLLUP(deptno, job))

where g_deptno = 0

and g_job in (0, 1);

# Composite column

select deptno, job, gender, sum(sal)

from emp2

group by deptno, job, gender;

select deptno, job, gender, sum(sal)

from emp2

group by rollup(deptno, job, gender);

--> deptno, job, gender

--> deptno, job

--> deptno

--> ()

select deptno, job, gender, sum(sal)

from emp2

group by rollup(deptno, (job, gender));

--> deptno, job, gender

--> deptno

--> ()

select deptno, job, gender, sum(sal)

from emp2

group by rollup((deptno, job), gender);

--> deptno, job, gender

--> deptno, job

--> ()

select deptno, job, gender, sum(sal)

from emp2

group by rollup((deptno, job, gender));

--> deptno, job, gender

--> ()

# Concatenated Groupings

select deptno, job, gender, sum(sal)

from emp2

group by deptno, rollup(job), cube(gender);

deptno job gender

() ()

--> deptno, job, gender

--> deptno, job

--> deptno, gender

--> deptno

select deptno, job, gender, sum(sal)

from emp2

group by GROUPING SETS((deptno, job, gender), (deptno, job), (deptno, gender), (deptno));

'IT 공방 > SQL' 카테고리의 다른 글

ORA-65096 오류 해결 (0)	2019.10.07

너무 늦은 후기가 아닐지 고민되지만

지금아니면 다음은 더 늦기에 오늘 마음먹고 하는 후기입니다.

공부기간

1. 데이터 모델링의 이해

이 부분은 거의 암기입니다.

저는 암기보다는 5~10회 완독을 여러번 하는 것을 추천드려요.

그리고 주요 단어만 선별해서 재 정리하시면 이부분은 어렵지 않게 통과할 수 있습니다.

(물론 알죠, 읽기 힘들고, 이해하기 힘들고, 빡세고... 시간이 없고... 공부하려면 자꾸 다른 생각이 나는거...)

저는 이부분은 처음 정리 한번 하고, 꾸준히 아침, 저녁 지하철에서 읽고 다녔어요

그러니까 시험 당일 아침에 한번 훑어만 봐도 되는거라 부담은 없었습니다.

2. SQL 기본 및 활용

저는 SQL, 오라클 수업을 한달 들었기 때문에 직접 cmd창에서 작성해 본 경험이 있어서 그런지

SQL을 이해하는 것에 큰 무리가 없었어요.

기본적으로 DDL, DML, DCL, TCL에 대하여 한번씩은 컴퓨터로 작성해보고 결과 보시면 좋을꺼같아요

오류를 내면서 배우는 것이 가장 정석적인 방법입니다.

저는 왜 그리 오타를 많이 치는지 항상 ...slec치고 다시 지우고 select라고 한자한자 치던 ㅋㅋㅋㅋ

만약 시간이 없으시다면 내용에 관련하여 이해하는게 중요하다고 생각합니다.

아마 처음 사용하시는 분들은 어떻게 조인이 되는지, 검색 결과나오는지 보지 않아서 어려울 수 있을텐데

SQL 수식을 여러번 보다보면 어려움 없을꺼에요

컴퓨터가 어려우면 손으로라도 한번씩 써보시는 것을 꼭 추천드립니다.

조인, 서브쿼리, 정렬 등등의 부가적 옵션 활용도 꼭 보셔야해요!

웹으로 SQL 실습할 수 있는 곳 입니다. 한번씩 작성해보시면 도움 되실꺼같아요!

https://www.w3schools.com/sql/default.asp

시험관련 정보

1. 통과기준

↓ 아래의 홈페이지에 자세히 나와있어요!

http://www.dbguide.net/da.db?cmd=snb_sqld_1

우선 전체 100점 만점 중 60점을 넘는게 중요하고

두번째는 과목별 40% 넘어야 합니다.

이말인 즉,

데이터의 이해부분은 20점 만점중 20*0.4 = 8점 이상이여야하고

SQL 부분은 80점 만점 중 80*0.4 = 32점 이상이여야 합니다.

두가지 조건을 전부 통과해야 합격이 가능합니다.

저는 처음에 40%조건이 상대평가인줄 알고... 덜덜덜 떨었어요

다들 저 시험이 시웠다고해서 사람들이 다 잘본줄알고 혹시 내가 40% 미만이면 어쩌지? 했는데

그게 아니더라구요 ㅋㅋㅋㅋㅋㅋ 역시 사람을 글을 잘 이해해야 심신이 편한거 같아요 ㅋㅋㅋㅋ

2. 교재

기본적으로 SQL 가이드를 참고하셔야 합니다.

서점에가서 구매하셔도 되고, 옥션이나 다른 온라인 사이트를 통해 구매하시면 좀 더 저렴하다고 알고있습니다.

하지만 전 아래의 사이트에서만 보고 따로 구매하진 않았어요!

http://www.dbguide.net/db.db?cmd=view&boardUid=148404&boardConfigUid=9&categoryUid=216&boardIdx=132&boardStep=1

대신, 문제집이 없어서 아래의 책을 구매했습니다.

한국데이터진흥원에서 출간한 책인 부분이 매우 중요합니다.

왜냐면 이 곳에서 시험 주관하니까요!! 어느정도 문제의 수준인지 확인 가능합니다.

이제 이 자격증이 중요해져서 그런지 다른 책들도 많이 나오는데

저는 위의 인터넷 사이트의 기본 개요 + SQL 실전문제 이 두 부분만 보셔도 충분하다 생각합니다.

3. 복원기출문제

복원된 기출 문제에 대해서 저는 아래의 카페 도움을 매우 아주 많이많이 받았습니다.

가입하셔서 공지사항 보시면 그동안의 기출 복원도 있고

제가 본 시험 뿐만 아니라 다른 횟차의 시험도 복원되어있습니다.

https://cafe.naver.com/sqlpd

여기 스터디도 같이 하는데 시간이 여유있으시다면 스터디 참가하셔서 정보 공유도 받고 하시면

더더욱 좋을꺼같아요

기타 사항으로...

항상 동국대인거같아요

1시에 시험보는데, 12시 30분까지 입실이라고 하지만 12시 50분쯤 오시는 분들도 꽤 많아요 ㅋㅋㅋ

만약, 동대입구역에서 먼저와서 공부하겠다 하시면 좀 일찍 가셔서 동대입구 스타벅스 추천해요

하지만 사람이 엄청 많아서 단체 스터디 하는 기분이지만 ㅋㅋㅋ 거기가 제일 공부하기 좋아요

주차도 가능하다고 하는데 전 차를 가져가진 않아서 확인해보시면 좋을꺼같아요

준비물은 컴퓨터용 사인펜과 볼펜인데

컴퓨터용 싸인펜 없으면 시험장에서 주세요. 그러니까 1층에서 구매하실 필요 없어요

동국대 매점에서는 300원인가 ? 팔았는데

1층 어머님은... 천원에 파시더라구요...

근데 시험장 가니까 공짜로 줬어요 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

신분증이랑 수험표 꼭 챙겨가세요!

궁금하신점 댓글로 남겨주심 답변드릴게용^^

시험 보시는 모든 분들께

합격 되길

기도합니다 파이팅!

'자격증 공방 > SQLD' 카테고리의 다른 글

별첨) SQL 정규화 방법 (0)	2018.07.17
제 5-3절 조인 수행 원리 (0)	2018.07.17
제 5-2절 인덱스 기본 (0)	2018.07.17
제 5-1절 옵티마이저와 실행계획 (0)	2018.07.17
제 4-8장 절차형 SQL (0)	2018.07.11

아래의 내용은 영우글로벌 러닝에서 진행된 4차 산업혁명 관련 교육과정에서 방형욱 강사님이 알려주신 내용을 기반으로 작성된 문서입니다.

# 정규화 방법

정규화되지 않은 상태

↓ 제1정규화(1 Normalization) : repeating group 제거

제1정규형(1 Normal Form)

↓ 제2정규화(2 Normalization) : 복합UID에 대한 부분 종속 제거

제2정규형(2 Normal Form)

↓ 제3정규화(3 Normalization) : Non-UID에 대한 종속 제거

제3정규형(3 Normal Form)

'자격증 공방 > SQLD' 카테고리의 다른 글

제 29회 SQLD 합격 후기 (4)	2018.08.29
제 5-3절 조인 수행 원리 (0)	2018.07.17
제 5-2절 인덱스 기본 (0)	2018.07.17
제 5-1절 옵티마이저와 실행계획 (0)	2018.07.17
제 4-8장 절차형 SQL (0)	2018.07.11

테이블 조인을 수행할 때 조인 단계별로 다른 조인기법 사용

1. NL JOIN

프로그래밍에서 사용하는 중첩된 반복문과 유사한 방식으로 조인 수행

결과를 가능한 빨리 화면에 보여주어야 하는 온라인 프로그램에 적당한 조인 기법

반복문 외부에 있는 테이블을 선행테이블 또는 외부테이블이라 하고 반복문 내부에 있는 테이블을 후행테이블 또는 내부테이블이라 함

FOR 선행 테이블 읽음 → 외부 테이블(Outer Table)

FOR 후행 테이블 읽음 → 내부 테이블(Inner Table)

(선행 테이블과 후행 테이블 조인)

먼저 선행테이블 조건 만족하는 행 추출하고 후행을 읽으면서 조인 수행, 선행테이블 조건만족하는 모든 행의 수만큼 반복 수행

따라서 만족하는 행수가 많으면 그만큼 후행 테이블 조건 작업 반복 수행

랜덤방식으로 데이터 액세스 하기에 처리 범위가 좁은 것이 유리

작업방식

선행 테이블에서 주어진 조건을 만족하는 행을 찾음 → 만족하지 않으면 해당 데이터는 필터링 됨
선행 테이블의 조인 키 값을 가지고 후행 테이블에서 조인 수행 → 선행테이블의 조인값이 후행에 존재하지 않으면 선행 테이블 데이터 필터링됨
선행 테이블의 조건을 만족하는 모든 행에 대해서 1번 작업 반복 수행 ← 인덱스에서 추출한 레코드 식별자를 이용하여 후행 액세스

save image

2. Sort Merge JOIN

조인 칼럼을 기준으로 데이터를 정렬하여 조인 수행 NL JOIN이 랜덤으로 읽던 것의 단점을 개선함

단, 정렬할 데이터가 많아 메모리를 넘어 임시 영역을 사용하는 경우 성능 저하 발생 그래서 대량은 HASH JOIN 사용

비동등 조인 조건에서 작업 가능한 것이 장점(HASH JOIN은 동등만 가능)

인덱스를 사용하지 않기때문에 인덱스 미존재시 사용가능

정렬 작업이 미리 수행되있는 조인은 추가 정렬 작업이 이루어지지 않음

save image

작업방식

선행 테이블에서 주어진 조건을 만족하는 행을 찾음
선행 테이블에의 조인 키를 기준으로 정렬 작업을 수행 → 조건을 만족하는 모든 행에 대해 반복 수행
후행 테이블에서 주어진 조건을 만족하는 행을 찾음
후행 테이블에의 조인 키를 기준으로 정렬 작업을 수행 → 조건을 만족하는 모든 행에 대해 반복 수행
정렬된 결과를 이용하여 조인을 수행, 성공하면 추출버퍼에 넣음

3. HASH JOIN

HASH 기법 이용하여 조인 수행

서로 동일한 해쉬 값을 갖는 것들 사이에서 실제 값이 같은지 비교하면서 조인 수행

NL조인의 랜덤 액세스 문제점과 Sort Merge JOIN의 정렬작업의 부담을 해결의 위해 등장

인덱스 존재 하지 않아도 사용 가능

동등 조건에서만 사용 가능

결과 행의 수가 적은 테이블을 선행테이블로 선정, 메모리 용량을 넘어서면 임시영역에 저장되기 때문에

그래서 선행 테이블을 Build Input, 후행테이블을 Prove Input으로 불림

save image

작업방식

선행 테이블에서 주어진 조건을 만족하는 행을 찾음
선행 테이블의 조인 키를 기준으로 해쉬 함수를 적용하여 해쉬 테이블 생성 → 조인칼럼과 SELECT 절에서 필요로 하는 칼럼도 함께 저장됨

→ 반복수행

후행 테이블에서 주어진 조건을 만족하는 행을 찾음
후행 테이블의 조인 키를 기준으로 해쉬 함수를 적용하여 해방 버킷을 찾음 → 조인 키를 이용해서 실제 조인될 데이터를 찾음
조인에 성공하면 추출버퍼에 넣음

→ 후행 테이블의 조건을 만족하는 모든 행에 대해서 반복 수행

'자격증 공방 > SQLD' 카테고리의 다른 글

제 29회 SQLD 합격 후기 (4)	2018.08.29
별첨) SQL 정규화 방법 (0)	2018.07.17
제 5-2절 인덱스 기본 (0)	2018.07.17
제 5-1절 옵티마이저와 실행계획 (0)	2018.07.17
제 4-8장 절차형 SQL (0)	2018.07.11

1. 인덱스 특징과 종류

테이블 기반으로 선택적으로 생성할 수 있는 구조, 생성하지 않아도 여러 개를 생성해도 됨

목적 : 검색성능의 최적화

단점 : DML 작업은 인덱스까지 변경해야 하기 때문에 느려질 수 있는 단점(업데이트 시 부하가 없을수도 있음)

가. 트리기반 인덱스

가장 일반적인 B-트리 인덱스

동등 조건 "="과 BETWEEN, >등의 연산자로 검색하는 범위 검색 모두 가능

인덱스 동일 칼럼으로 구성된 것을 중복 생성은 불가능, 하지만 동일한 칼럼 순서를 변경하면 서로 다른 인덱스 생성 가능

이 외에도 ORACLE은 비트맵인덱스, 리버스키 인덱스, 함수기반 인덱스 존재

save image

루트 블록 : 가장 상위 단계
브랜치 블록 : 분기를 목적으로 함, 다음단계를 가르키는 포인터를 가지고 있음
리프 블록 : 가장 아래 단계, 인덱스를 구성하는 칼럼의 데이터와 행의 위치를 가르키는 레코드식별자(RID)로 구성

인덱스 데이터는 인덱스를 구성하는 칼럼의 값으로 정렬, 양뱡향링크를 가지고 있어서 오름차순, 내림차순 검색 가능

비트맵 인덱스 : 사용될 질의 시스템 구현시 모두 알 수 없는 경우인 DW 및 AD-HOC 질의환경을 위해 설계

하나의 인덱스 키 엔트리가 많은 행에 대한 포인터를 저장하고 있는 구조

나. SQL SERVER의 클러스터형 인덱스

저장구조에 따라 클러스터형과 비 클러스터형으로 나뉨

인덱스의 리프페이지가 곧 데이터 페이지, 탐색하면 모든 칼럼값을 곧바로 얻을 수 있음
인덱스 키 칼럼 순으로 물리적으로 정렬되어 저장, 한가지 순서로만 정렬, 인덱스는 한개만 생성 가능

2. 전체 테이블 스캔과 인덱스 스캔

가. 전체 테이블

테이블에 존재하는 모든 데이터를 읽어가면서 조건에 맞으면 결과로 추출하고 맞지 않으면 버리는 방식

ORACLE : 고수위 마크(데이터가 쓰여있던 블록 최상의 위치) 아래의 모든 블록을 읽음, 오래걸릴 수 있음

재사용성이 떨어지기에 메로리에서 제거할 수 있도록 관리

왜 전체 테이블을 읽어야하나?

SQL 조건이 존재하지 않는 경우, 모든 데이터가 답이 될 수 있기에 무조건 결과로 반환
주어진 조건에 사용 가능한 인덱스가 존재하지 않는 경우, 함수를 사용하여 인덱스 칼럼을 변형해도 사용 불가
조건에 만족하는 데이터가 많아서 블록을 다 읽어야 한다는 옵티마이저의 판단에 의해
병렬처리 방식으로 처리하는 경우
전체 테이블 스캔 방식의 힌트를 사용한 경우

나. 인덱스 스캔

인덱스를 구성하는 칼럼의 값을 기반으로 데이터를 추출하는 액세스 기법

검색을 위해 리프블럭을 통해 인덱스 구성 칼럼 값과 레코드 식별자 확인 가능

인덱스가 존재하지 않으면 레코드 식별자 통해 테이블 액세스 해야함

인덱스 유일 스캔 : 유일 인덱스를 사용하여 단 하나의 데이터 추출, 중복불허, 모두 동등조건값 "="에 대해 가능한 인덱스 스캔방식
인덱스 범위 스캔 : 한건 이상의 데이터 추출, "="로 값이 주어지지 않은 경우와 비유일 인덱스를 이용하는 모든 방식
인덱스 역순 범위 스캔 : 양뱡항 링크를 이용해 내림차순으로 데이터 읽는 방식, 최대값 쉽게 찾음
이외에도 인덱스 전체 스캑, 고속전체스캔, 스킵스캔 등이 존재

다. 전체 테이블 스캔과 인덱스 스캔 방식의 비교

인덱스 스캔은 불필요하게 다른 테이블 블록 불필요 → 한번의 입출력 요청에 한 블록씩 데이터 읽음

전체 인덱스 스캔은 한번의 입출력 요청에 여러 블록 테이블 읽음, 모두 읽을꺼라면 유용

대용량 데이터 중 극히 일부의 데이터를 찾을 때는 인덱스 스캔 방식 사용

반대로 대부분의 데이터를 찾을 때는 전체 테이블 스캔 방법 유리

'자격증 공방 > SQLD' 카테고리의 다른 글

별첨) SQL 정규화 방법 (0)	2018.07.17
제 5-3절 조인 수행 원리 (0)	2018.07.17
제 5-1절 옵티마이저와 실행계획 (0)	2018.07.17
제 4-8장 절차형 SQL (0)	2018.07.11
제 4-7절 DCL (0)	2018.07.11

문과생이 공대에서 살아남기

sql

SQL 집합(Aggregation)

# Rollup

# Cube

# 집계 기준 컬럼이 3개일 경우

# GROUPING 함수

# Composite column

# Concatenated Groupings

'IT 공방 > SQL' 카테고리의 다른 글

제 29회 SQLD 합격 후기

'자격증 공방 > SQLD' 카테고리의 다른 글

별첨) SQL 정규화 방법

'자격증 공방 > SQLD' 카테고리의 다른 글

제 5-3절 조인 수행 원리

'자격증 공방 > SQLD' 카테고리의 다른 글

제 5-2절 인덱스 기본

'자격증 공방 > SQLD' 카테고리의 다른 글

+ Recent posts

티스토리툴바