비전공자인 나에게 정보처리기사는 매우 어려운 도전이었지만

동회차에 끝낼 수 있는 것은 정말 기적같은 일이었다.

신기술용어와 SQL용어 1개씩 총 2개를 틀렸다. 

그래서 이렇게 높은 점수를 얻을 수 있었다.



1. 교재

필기는 무조건 시나공이었는데

실기는 이기적이 좋다고해서 고민이 많았다.

하지만 이기적에 오탈이 많다고 했고 내부 디자인이 시나공에 더 익숙했던 탓일까

나는 시나공을 선택했고 알라딘에서 4권 분철 신청을하여 손쉽게 들고 다녔다.


하지만 확실히 교재로만으로는 부족한 부분이 있고

동영상강의가 필요했다. 

그래서 유튜브의 "유수샘" 강의를 찾아서 보았다.

진짜 이강의가 너무나 도움되었다.


또한 산업기사와 같이 책에 나와있어서 아래의 범위를 참고해서 보면 더 효율적으로 공부할 수 있다.

(기출문제를 풀어봐도 산업기사가 더 어려운듯... 산업기사는 깊이를 기사는 넓은 범위가 시험 의도라고 어디서 본듯한...)

피보나치수열, 약수, 최소공배수/최대공약수

선택정렬, 버블정렬, 삽입정렬, 화폐매수구하기

이차원배열 (달팽이집, 다이아몬드, 90도회전, ㄹ자, 모래시계, 행열변환)

2진수 덧셈, 그레이코드, 보수



2. 용어들

어떤게 나올지 전혀 알수가 없기에... 운이 필요한 것

나는 2가지를 추천한다


1) 퀴즐렛

어플을 다운받아서 직접 자신이 문제를 만들수도 있고 아님 나와있는것을 사용할 수 있는데

단순 단어를 암기하는데 주관식으로 맞추기 너무 좋다. 일주일만해도 거의 다 암기되지만 시험뒤에 남을수없다는게 문제 ㅋㅋㅋ


2) 카카오톡 단체채팅

쉴틈없이 문제를 내고 맞추고 그러다보면 잘하는 사람 보면서 부럽기도 하면서 나또한 열심히 해야겠다는 마음가짐을 가지게 된다.

그리고 다른 부분도 서로 묻고 답할 수 있어서 매우 유용하다고 생각한다.

주위에 정보처리기사 공부하는 사람 없이 나 혼자인 경우에 엄청 유용하게 잘 활용했고

실제로 여기서 공부했던 주관식 문제가 거의 다 나왔을 정도니까... 말 다했다

그리고 답도 제일 빨리 올라온다 거의 1시 되니까 정답이 다 정리된 ㅋㅋㅋㅋ



이번 2019년 이후에는 가져갈 수 있는 계산기가 정해졌기때문에 계산기 필요하신 분들은 

미리 꼭 체크하고 가시길!


나는 4색펜을 가지고가서 샤프로 문제풀고 답은 검은색 펜으로 작성했는데

몇 문제 옆에 샤프로 푼 곳을 안지우고 나와서 걱정을 했지만

그정도는 봐주는듯하다

단, 답안 쓰는 곳에는 반드시 검은색 볼펜으로 답만 쓰길 바란다


나는 한달간 공부했고

마지막 2주간은 하루에 8시간씩 공부했다.

마지막 주간은 대부분 단어암기로 많이 활용했다.


저희 후기가

다음에 시험보시는 분들에게 도움이 되길 바랍니다.


1. 업프 15점
- EA
- ERP
- EAI
- MOT
- VOC

2. 신기술 15점
- TEE (트러스트존이랑 둘 중 뭐일지 ㅠㅠ)
- QKD
- APT
- 가용성
- kill switch

3. 6점
- O (이건 교재마다 상이해서 문제가 될듯..)
- O
- 타임스탬프

4. 5점
SELECT 학번
FROM 학생
WHERE 이름 LIKE ‘이%’
ORDEY BY 학년 DESC;

5. 전산영어 10점
- VPN
- VoIP
- DRM

6. 12점
- 스키마 (어트리뷰트 가 답인듯 똥멍충...)
- 튜플
- 도메인
- NULL
- 디그리 (차수 도 맞는듯)
- 카디널리티


7.스택 5점
- NEXT
- pop( )
이거 대소문자 때문에 틀릴듯 ㅠㅠ Next Pop( ) 맞을듯


8.랜덤주사위 5점
- n-1
- hist[i]


9.자바 3점
12

10. 10점
- MEMS
- 위키노믹스
- 웨버홀리즘
- 컴패니언 스크린
- IMT-2020

11. 그레이코드 12점
Input(2)
Input(t+2)
Binary(t+1)
Input(j+1)
Gray(j+1)
K=1,4,1


12.디비 2점
1

2018년 9월 21일 오후 2:30분 (원래는 3시 발표였는데 좀더 빨리나왔네요) 18회 결과가 나왔습니다.

SQL때도 보니까 항상 결과는 일찍 나왔던거 같아요

저는 비전공자이고 그냥 수학을 조금 좋아하지만 미적분도 모르는... 무지랭이 ㅋㅋㅋ 이었습니다.




공부방법

1, 3 과목은 그저 계속 읽으면서 익숙해지는 방법 밖에 없습니다.

주관식보다는 객관식을 다 맞게다는 마음으로 공부하다보면 주관식도 맞출 수 있어요

읽다보면 중요한 단어가 무엇인지 감이 와요 ㅋㅋㅋ

아 문제 풀다보면... 감이와요 ㅋㅋㅋ


4과목은 제일 시간이 많이 걸리지만

생각보다 어렵지 않게 나오는 부분이에요

다른 분들의 말을 들어보니 R과 통계는 어렵게 나와도 

정형데이터마이닝은 기본적인 이론만 나온다고 하셨는데

변별력을 요하는 부분만 아니면 (그정도는... 틀려도 합격에 문제가 없기에)

어렵다... 포기할까 하지마시고 이론만 빠삭 외워가면 도움 될 것이라 생각듭니다.


교재

교재는 제가 따로 포스팅 했습니다.

무조건... 실기 문제 풀이집은 풀고가세요

그럼 진짜 붙을 수 있어요!!!!!!!!!!!!!!

전 이번 시험의 합격의 공은 풀이집에 이 모든 영광을 돌립니다.





기타사항으로는

이번에도 동국대에서 시험봤어요

그리고 SQLD보다 ADSP가 시험장이 훨~~씬 많아서 경영관까지 가서 봤어요

1시 시험인데 12:50까지 입장했었고 (더 늦은분도 있는듯... ㅋㅋ)

컴퓨터 싸인펜은 여전히 공짜로 나누어 주셨어요

동국대 주차 가능합니다. 올라오셔서 주차하시면 됩니다.


또... 궁금한거 있음 댓글주세요 

아는 부분은 공유드릴게요 ^^


모든 분들이 합격하시길 기도합니다.

즐거운 추석 보내세요 


  1. 필립이 2019.02.16 07:40 신고

    안녕하세요,

    데이터 분석 준전문가 준비 과정에 대한 글과 정보 감사합니다.

    데이터 분석과 데이터 모델링을 토대로 한 의사결정에 대한 전반적인 관심이 있으시면 비즈니스 인텔리전스 툴인 마이크로스트레티지 웹사이트에도 한번 방문 부탁드립니다.

    https://www.microstrategy.com/kr/products/capabilities

    감사합니다!

  2. Brightics 2020.04.12 15:18

    안녕하세요.
    각 과목별 정리도 너무 잘 하시고., 친절한 후기 까지 정말 고맙습니다.
    그냥 읽고 가기에는 죄송스러워서 인사남깁니다.
    다른 글들도 몇몇을 보니 문과생이셨지만 공대에서 뿐만이 아니라 데이터분석 분야에서도
    "잘" 살아 남으실것 같습니다. 아니., 꼭 그러실 것 같습니다.
    IT회사에서 오래 일하고 있는데 여기서 한수 더 배우고 갑니다.
    고맙습니다. 꿈을 이루시길 응원하겠습니다.

요새 SQLD와 ADSP 자격증의 인기가 높아져서 그런지

베스트셀러에 심심치 않게 올라와있고 계속 베스트셀러로 되어있고

아직 인기있는지 얼마 안되서 다른 분들이 교재 선정에 어려움이 있을 것 같아 도움 드리고자 이렇게 포스팅 합니다.


저는 공부할 때 교재 욕심도 있고, 많은 교재를 다양하게 보는 것을 좋아해서 총 4권의 책을 봤어요

책마다 교재의 장담점을 설명해드리고

마지막으로 추천해 드릴게요 

어디까지나 저의 주관적인 생각이고 의견이니 

직접 서점가서 보시는 것을 추천드립니다!!!!


1. 데이터분석 전문가 가이드

한국 데이터 분석 진흥원 (50,000원 정가)

장점

- 뭐니뭐니해도 시험을 주관하는 곳에서 낸 교재이기 때문에 가장 정확한 내용을 포함하고있음

- 상세하게 설명되어있고 4절의 R파트도 자세히 설명되어있음

단점

- 가격이 비싼만큼 무게도 어마어마함, 스캔을 하시거나 분철하시길 추천함

- 준전문가만 있는게 아니라서 불필요한 내용이 있지만, 전문가까지 보시는 분들에게는 반대로 장점이겠죠?

- 문제가 부실함, 각 장마다 연습문제가 5~10개정도 뿐임, 그리고 연습문제는 너무 쉬움

꼭 구매할 때 2017년 이후 버전으로 구매하셔야해요 이전버전이랑은 아주 많이 다름



2. 데이터분석 자격검정 실전문제

- 한국데이터 진흥원 (15,000원 정가)


장점

- 문제가 매우 많음

- 여기서 푼 문제가 진짜 이번 18회에 엄청엄청 많이 나왔음!!!! 이건 무조건 봐야했을 정도

- 답안지가 분리되어 제본되어있어서 공부하기 좋음

단점

- 정말 문제만 있음, 개념을 공부해야하면 다른 책이랑 병행하거나 인터넷 검색 필요



3. 데이터분석 준전문가 2018

- 데이터에듀 (27,000원 정가)


장점

- 교재와 병행되는 인터넷 강의가 있음 (하지만 전 수강하지 않았어요)

- 가장 오랫동안 데이터 준전문가에 대한 교재를 출판했고, 따로 홈페이지내에 기출 복원도 제공함

- 그동안의 기출 문제도 범위마다 제공해줌

단점

- 2017년 진흥원의 가이드책으로 나온 곳이랑 범위가 조금 다름 2019년 개정판은 변화되길

- 기출문제로 표시된 것 외의 직접 내신 문제는... 범위가 달라서인지.... 풀이를 추천하긴 어려움

- 맨뒤의 기출문제 및 모의고사의 문제 풀이 해설이 미약함



4. 데이터분석 한권으로 끝내기

- 황소걸음 아카데미 (23,000원 정가)

장점

- 2017년 진흥원 가이드에 나온 교재를 가장 요약 잘함, 기출에 잘 나오는 부분이 체크되어있었음

- 요즘 가장 최근에 나온 책

- 예상문제도 많고, 데이터진흥원 실전문제에서 나온 문제도 꽤 실려있음

단점

- 오탈자가 많음, 아무 많음, 아무래도 처음 나온 책이라 보니..

- 틀린답도 많음, 근데 어디서 오탈자를 확인해야할지 모르겠음 ㅜㅜ 질문을 어디다 해야할지....



나는 준 전문가 준비기간이 길고 공부를 깊게 하고싶다.

데이터진흥원가이드 + 실전문제 > 데이터에듀 = 한권으로 끝내기


나는 시간이 없고 빠르게 공부하고 싶다.

한권으로 끝내기 + 실전문제 > 데이터에듀 > 데이터 진흥원 가이드


나는 이론은 많이 알고있다. 그냥 문제만 풀고싶다.

실전문제 > 한권으로 끝내기 > 데이터 에듀 > 데이터 진흥원 가이드


무조건 데이터진흥원에서 출판한 2번에서 추천한 실전문제는 꼭 한권 푸시고 가세요

이것도 문제가 꽤 많이 때문에 한문제 한문제 보기까지 잘 숙지하고 가기 쉽지 않아요

하지만 진짜 많이 나온다는거

보기만 잘 봐도 답이 나온다는거 매우 중요합니다.


지난 17회에서 2017년 개정판이 아닌 그 이전의 가이드 책에서 나온 문제가 출제가 되어

3문제를 전원 정답한 사례가 있어서 데이터 진흥원에서는 무조건 그 범위내의 문제를 내기 위해

철저하게 관리하실 것으로 예상됩니다.

그러므로 꼭 범위 잘 확인하시고 공부하시길 바랍니다.

괜히 다른 부분 공부하고 시간 낭비하지 않으시길 ㅜㅜ


모두모두 합격하세요~~~



  1. 강다리 2018.09.16 23:23

    다른 책 리뷰는 약간 바이럴 광고 탄 거 같은데 이 글은 진정성 있는 글이었습니다. !!! 홧팅

    • 가이아쥐 2018.09.17 00:11 신고

      제가 전부 사서 사용해보고 시험봐보니... 다른 분들은 더 좋은 방식으로 공부하시길 바랬어요^^!! 좋은 댓글 감사합니다^^

  2. 벨벳스타 2018.10.31 06:32

    멋지십니다. 그리고 고맙습니다

  3. 익명 2018.11.08 00:39

    비밀댓글입니다

  4. sun 2019.02.09 17:28

    정말 많은 도움이 되었습니다.

  5. 익명 2019.02.26 12:57

    비밀댓글입니다

    • 가이아쥐 2019.02.27 13:06 신고

      네 책으로만 공부했습니다
      개념위주인데 개념없이 공부하시는분들이 본교재(약 5만원가량)을 구매하기 어려울때 좀 더 저렴히 구매가능합니다. 그리고 기출문제도 있구요!
      이번에 개정판이 시험범위정리되서 좋은거 같던데 개정판으로 구매해도 좋을꺼같아요 :)

    • 가이아쥐 2019.02.27 13:08 신고

      하지만 가장 중요한 책은 제가 시험 친 경험으로는 2번째 자격검정 실전문에였어요! 거기서 비슷하게 많이 나왔어요
      개념은 이미 아신다면 문제 계속 푸시는 것도 추천드려요!

  6. 취뽀 2019.03.08 15:12

    정말 감사합니다 공부시작하는데 교재들 어떤것 선택해야할지 좋은 지표가 될 것 같아요! 감사합니다.

  7. heejung 2019.04.28 10:36

    데이터분석자격검정 2번 문제집은 2017.02월꺼인데 시험개정범위가 적용되어있는건가용???

    • 가이아쥐 2019.05.09 20:48 신고

      네 개정판은 2016년도에 나와서 그 후에 문제집만 따로 나온거에요 ~~ 범위에서만 풀면 되어요^^

  8. 연리지 2020.01.14 22:47

    비전공자이고 너무 막연해서 이렇게 실례를 무릅쓰고 글을 드려요 이론 개념 전무한 상태이구요
    잘 알아보지도 않고 한권으로 끝내기 책을 구입해버렸는데.. 저같은 경우 책 추천 해 주신다면 어떤책이 좋을까요?

    • 가이아쥐 2020.01.23 13:48 신고

      무엇보다 저한테 가장 도움된건 기출문제집이였어요!
      데이터분석 자격검정 실전문제가 정말 도움되었는데, 이게 개정판이 나온다는 이야기도 있는데 한번 알아보시면 좋을것같아요
      제일 좋은건, 그 문제집 다 푸시고 온라인에 기출문제 사람들이 올려둔거 다 보고가시면 어려움없으실꺼에요! 기출에서 많이 나와요!
      한번에 합격하시길!!! 파이팅!!!

  9. ㅅㅇ 2020.12.11 06:16

    감사합니다 ㅎㅎ 큰도움이되었네요

3과목은 가장 범위도 넓고 
수학적, R용어적 지식도 필요하기에 
가장 오랜 기간 공부한 부분입니다. 
수식 부분 안나온다고해서 공부 안했는데 
맨하튼 거리가 나올줄 ㅋㅋㅋ 
당했네요 ㅋㅋㅋㅋ

객관식은 정확히 틀린건 5개, 정답이니 아닌지 모르는 것은 3개입니다.
주관식은 2개 틀렸습니다.
그래도 보수적으로 30문제중 20개 맞춰서 
과락기준 12개 이상 맞춘거니 과락은 면했습니다. ㅠㅠ 다행이네요 ㅠㅠ

 ((▲) 표시는 정확히 답인지 헷갈리는 문제에요! 그리고 모두 정답으로 확정 된것은 아닙니다!)



객관식1. 회귀모형의 변수선택법이 아닌것은? (▲)
정답 : 주성분 분석 
라쏘, 모든회귀분석 등이 보기로 나왔는데
라쏘와 주성분분석 중 어떤게 답이냐고 다들 엄청 말이 많으셨는데
전 모든회귀분석을 찍었죠 ㅋㅋㅋㅋㅋ 전 그냥 틀렸던
저는 전진선택, 후진제거, 단계선택만 외우고 갔고 모든회귀를 너무 쉽게 생각했었나봅니다.

객관식2. 회귀 그래프와 R명령어  (▲)
정답 : lm(Balance~Income+Student, data=Credit)
학생이 여/남이었는지 인지 아닌지였는지... 기억이 안나나 명목척도였었어요
그래서 고민이 되었죠 Income은 비율척도이고 학생은 명목척도라서
그래도 두 설명변수가 필요할것같아서 선택했었요.

객관식 3. 거리 활용한 측도에 대한 설명으로 틀린것은?
정답 : 마할라노비스
군집 방법에 대한 수식 설명이 나올줄은 몰랐어요
유클리드, 맨하튼 등의 수식들의 대해서 물어봤고
여기의 맨하튼 구하는 공식에 대한 설명 덕분에 주관식을 맞출수 있었던 감사했던 보기입니다.
마할라노비스는 변수의 표준화와 함께 변수간의 상관성을 동시에 고려한 통계적 거리입니다.
상관성을 고려할 수없다고 표시되어 틀렸다 라고 답하였습니다.

객관식 4. 데이터 정규성 확인 방법이 아닌것은?
정답 : Durbin-Watson
사피오 테스트, 히스토그램, 큐큐플랏이 보기었는데
큐큐플랏은 정확히 맞다는 것을 알았는데... 
히스토그램도 정규성 검사 가능하다는 것을 알았는데...
그런데 틀렸네요 ㅋㅋㅋㅋㅋ 

객관석5. 상관분석에 대한 설명이 잘못된 것은 ?
정답 : 종속변수 값을 예측하는 선형모형 추출 방법이다
피어슨 상관계수, 스피어만 상관계수에 관련하여 보기가 나왔고
상관관계에 대해서만 나오는거지 값을 예측하는 방법은 아니어서 틀렸고
저도 틀렸던거 같아요 ㅋㅋㅋ 전 3번을 찍었는데 저건 4번 보기거든요...
틀린 답이 기억이 안나네요 ㅜㅜ

객관식6. 데이터마이닝 단계 중 목적변수를 정의하고 필요한 데이터를 데이터 마이닝 소프트웨어에 적용 할 수 있게 데이터를 준비하는 단계는?
정답 : 데이터 가공
4-3 제1절의 단계별 추진단계입니다. 자주 나오는 부분이에요 특히 가공이요
만약 시간이 없다면 데이터 가공만이랑 
목정정의, 데이터준비, 데이터가공, 기법적용, 검증의 순서라도 외우고 가세요

객관식7. 연관규칙의 향상도 설명이 옳은것은?
정답 : 향상도가 1보다 크면 결과가 우수하다
4-3의 연관규칙의 향상도는 1이면 서로 독립 1보다 크면 양의 상관관계
그리고 향상도, 지지도, 신뢰도의 수식은 꼭 나오니 외우고 가세요

객관식8. R 데이터의 저장형식 내용으로 부적절한 것은?
정답 : as.vector 함수 적용시 데이터는 1행부터 차례로 생성된다
4-1의 R 부분에서 나온것입니다.
벡터, 행렬에 대한 질문에 대한 보기와 함께 나왔어요
저는 이문제를 다른 보기들은 다 정답이고 이 보기만 제가 모르는 부분이라 선택했습니다.

객관식9. 의사결정나무 그림보고 해석으로 부적절한 것은?
정답 : 끝 노드로 갈수록 불순도가 안좋아진다
4-3의 의사결정나무의 모형이 나오고
그 나무가 가지가 갈라질때의 숫자와 확률을 보고 기준점보다 크면 확률이 어느정도인지의 보기와
의사결정나무의 이론적 질문이 보기로 나왔습니다. 
의사결정나무가 진행될수록 불확실성은 점점 줄어들기에 불순도가 없어지죠. 순수도가 높아집니다.

객관식 10. 각 열이 서로 다른 타입의 데이터 구조가 가능한 것은?
정답 : 데이터프레임(dataframe)
4-1 R교재에는 벡터, 행렬, 데이터프레임만 나옵니다.
그렇기에 그 외의 질문이 답이라면 문제가 되겠죠? 
각 열에 서로 다른 타입을 가질 수 있는 것은 데이터 프레임만 입니다.
이쪽은 자주 나오니 꼭 기억해주세요

객관식 11. 비모수 검정의 특징이 아닌것은?
정답 : 평균, 분산을 이용한 검정을 이용한다 

4-2절의 제 1절 마지막 부분에 나오는 비모수 검정은 항상 저 보기가 답으로 나오더군요

비모수적 검정 방법 : 모집단의 분포에 대해 아무 제약 가하지 않고 실시, 특정분포를 따른다고 가정 없음

ex) 부호검정, 순위합검정, 부호순위합검정, U검정, 런검정, 스피어만의 순위상관계수


객관식 12. SOM에 대한 설명이 잘못된 것은?
정답 : SOM 은 역전파 알고리즘을 사용한다(이건 신경망입니다)

4-3의 제3절 군집분석, 비지도 학습 중 자기조직화지도, 코호넨 맵이라 불리는 SOM 입니다.

비지도 신경망으로 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도 형태 형상화

승자 독식 구조로 인해 경쟁층에는 승자 뉴런만 나타남

SOM 이용한 군집분석은 역전파 알고리즘과 달리, 하나의 전방패스 사용함으로 속도가 매우 바르고 실시간 학습처리가 가능이 보기였습니다.


객관식 13. 추정/가설검정에 대한 설명이 부적절한 것은? (▲)
정답 : 모르겠어요... 이건 채점결과 나오면 알 수 있을 듯 합니다. 
   저는 기각역을 택했어요 제 기억에는 기각역이 대립가설을 기각하는 통계량의 영역이 보기었던거같아서 
점주청, 구간추정, 유의수준에 대한 p-value, 기각역이 나왔습니다.
점 추정 : 특정값을 구하는 것
구간 추정 : 일정한 크기의 신뢰수준으로 모수가 특정 구역에 있다고 하는 것
p-value : 귀무가설이 사실일 , 관측된 값보다 대립가설을 지지하는 검정통계량이 나올 확률
기각역 : 귀무가설을 기각하는 통계량의 영역

객관식 14. Bias-variance trade off 관계에 대해 모델의 유연성이 크다면 분산과 편향은?(▲)
정답 :  높/낮
이것도 정확히 답이 책에 나와있는 것은 아닙니다.
다만 카페와 데이터에듀의 답을 비교해보니 정답이라고 했습니다.
전 유연성이 크니 분산의 넓이는 크다고 예상했고 트레이트 오프니 분산과 편향은 반비례관계라고 생각하여 선택했죠
이부분도 점수가 나와봐야 알 수 있을 듯 합니다.

객관식 15. Chickwts 데이터 주고 설명이 부적절한것은? 
정답 : 첨가물의 개수는 5개이다
다중 회귀분석 모델을 보여줍니다.
여기서 자유도 부분을 알아야하는데, 표본에 관련하여 기술통계값을 낼때는 변수 숫자에 따라 -n를 합니다.
그래서 표에 나왔는 것이 5라면 실제 분석에 쓰이는 데이터는 7개 입니다. (설명변수가 2개인 경우)
표에 나와있는 답에 자유도 부분을 더해야 합니다.

객관식 16. 보험사 해지할 예상 고객을 예측시 사용할때 쓸 적절한 기법은?(▲)
정답 : 랜덤 포레스트 라고 선택했으나 주성분 분석이라고도 하셔서..
이 부분도 정답이 정확히 책에 나와있지는 않았습니다.
다만 여러가지 요인이 나오고 그에 따른 고객 데이터 예측이라 저 또한 주성분분석과 랜덤포레스트를 고민했으나
주성분분석은 분류에 랜덤포레스트는 다양한 모델 분석을 통한 예측이 가능하여 우선 랜덤포레스트를 했으나
다른분들이 주성분 분석으로도 예측이 가능하다고(그리고 생각해보니 그러하여) 확답을 낼 수 없는 부분입니다.

객관식 17. 광고 채널 상관관계표 주고 설명한 내용중 잘못된 것은?
정답 : TV광고와 Sales는 증가하는 인과관계를 가진다
이건 명확히 자주 나오는 답입니다. 상관관계는 인과관계를 가지지 않습니다
반드시 이해해야하고 어떻게든 다른 문제로도 이부분은 꼭 질문하는 것 같습니다.

객관식 18. 회귀분석과 결정계수 설명이 부적절한 것은?
정답 : 총변동과 오차에 대한 변동 비율이다

4-2의 제2절 회귀분석 부분에서 나옵니다.

결정계수 : R-squared 0~1사이에서 1 가까워야 설명을 하고 있다고 판단

회귀계수는 해당 계수의 t통계량과 p- 또는 이들의 신뢰구간 확인

결정계수 확인, 0~1사이 값을 가지며 높은 값일 수록 설명력이 높다


객관식 19. 귀무가설이 사실인데 기각하는 1종 오류시 우리가 내린 판정이 잘못되었을 실제 확률은?
정답 : P-value
알파, 1-알파, 검정통계량이 보기였습니다.
알파냐 p-value냐에 대해서 사람들이 고민 많이 하셨는데 책에 우선은 p-value로만 나와있습니다.
이 또한 점수가 나와야 알 수 있을 듯 합니다.
그리고 객관식 13번의 보기와 비슷해서 답이 유추가 가능했던 문제였습니다.

객관식 20. 회귀분석에 대한 설명으로 부적절한 것은?
정답 : 귀무가설은 기울기가 0이 아니다
회귀분석의 귀무가설과 대립가설에 대한 부분이었습니다. 
기울기는 1이다 아니다를 이야기합니다. 0이 아닙니다.

객관식 21. 교차 판매/물건 배치등에 이용되는 기법은?
정답 : 연관분석
물건 교차 판매 및 배치에 대한 원리에 대해 이용되는 기법은 연관분석
이 문제는 기출로도 많이 나왔고 책의 문제로도 나왔습니다
꼭 알아두고 시험 보시면 좋아요!

객관식 22. R패키지 설명으로 틀린것은?
정답 : data.table에서 리스트로 변경되면 ddply를 사용 할 수 있다 (가 아니라 dlply입니다)
4-1 R파트의 제 2절 plyr, sqldf, reshape관련 보기가 나왔습니다.
이부분은 주관식으로도 자주 기출된다고 합니다. 기본적 이론만 외워도 좋을 것 같습니다.

객관식 23. y=c(1,2,3,NA)일때 3*y의 결과
정답 : 3,6,9,NA
저는 ㅋㅋㅋ 이 문제에 낚여서.... 헝 ㅜㅜㅜ 
우왕 쉽다. 이건 바로 에러지 에러가 난다로 선택했는데
문제를 더 꼼꼼히 읽어볼껄 그랬습니다.
mean(y) 로 했으면 에러였는데, 단순 곱셈이었습니다.

객관식 24. 기법 활용 분야가 다른것은?
정답 : SOM( 에만 비지도학습이고 나머지 보기는 전부 지도학습이었습니다)
4-3의 제 2절, 3절의 지도학습/비지도학습에 대한 질문이었습니다.
지도학습 : 로지스틱회귀분석, 신경망, 의사결정나무, 앙상블
비지도학습 : 계층형 군집분석, k-평균, 혼합분포군집, SOM 


주관식 1. 보기의 표를 보고 정확도(Accuracy) 를 구하여라
정답 :  (a+d)/(a+b+c+d) 
4-3 오분류표에 대한 문제고 이건 매번 나옵니다.
저는 정확도라는 글자만 보고 정확도를 구했는데
사실 책에는 영어로 Accuracy는  한글로는 정분류율 입니다. 
책에서는 정확도(Precision)는 TRUE 예측한 관측치 실제값이 TRUE 정도입니다.
영어를 놓치고 한글만 본 저의 문제겠지요 ㅠㅠ
하지만 책에는 이렇게 나와있으니 한글과 영어의 표기를 문제 출제시 맞춰주면 좋겠다는 바람입니다. 

주관식 2. 맨하턴거리 구하기
정답 : 2
각 좌표의 직각 거리 계산하면 되는데
(3,4) (4,5)의 거리여서 삼각형 상의 1 + 1 이라 2를 했는데
이게 답이라고 하더라구요 ㅋㅋㅋ 이건 객관식 3번의 도움이 없었다면 절대 풀수없었을 것 같습니다.

주관식 3. 재표본 과정에서 자료에 동일한 확률 부여하지 않음, 분류가 잘못된 데이터에 가중을 주어 표본을 추출
정답 : 부스팅
원래 기출은 랜덤포레스트나 배깅을 물어보던데 이번에는 부스팅이네요
이로써 앙상블 모델의 부분은 주관식으로 다 나왔어요 ㅋㅋㅋ 앞으로도 나올 가능성이 높겠네요

주관식 4. 추세를 보이는(평균이 일정하지 않으면) 시점의 자료값 - 시점의 자료값 하는 것은?
정답 : 차분
저는 AR모델이라고 적었지만 나와서 확인해보니 차분이 맞습니다
저는 틀렸지만 ㅜㅜ 여러분은 맞추시길 바랍니다.

주관식 5. 단순회귀분석의 최소제곱추정량 : 제곱오차를 최소로 하는 값은 방법은?
정답 : 최소자승법, 최소제곱법
4-2의 단순회귀 부분에 3줄 정도 아주 짧게 나온 부분인데 이게 주관식으로 나와서 당황했습니다.
하지만 어서 들었던 기억에 ㅋㅋㅋ 정답을 맞출 수 있었습니다. 

주관식 6. 기준점 = 150으로 하면 몇개의 군집이 되는가?
정답 : 3
이건 어렵게 보시지 말고 y축의 값에 150으로 쭉 선을 그르면 의사결정나무의 가지들이 몇개가 걸리는지 확인하시면 됩니다.


4과목은 R에대한 수식이 너무 많아서 고민이실텐데
ADSP는 정확한 수식보다는 각각의 분석모형에 대한 이해가 중요합니다.
사실 너무 어렵다면 R부분을 제외하고 나머지 모형을 이해만 하셔도 됩니다.
회귀분석, 의사결정나무 정도의 R의 결과값만 이해하는 정도만 된다면 어렵지 않을 것 같습니다.

이번 기출은 통계에서 많이 나왔습니다.
통계부분이 매우 중요합니다.
가채점 결과는 통과지만 이건 가!채!점! 이기 때문에 떨어질수도 있죠
그래서 떨어지고 다시 재 시험을 보게 된다면 통계부분을 더욱더 열심히 공부할 것입니다.

모두 좋은 결과 있으기실 바랍니다
다음은 제가 공부했던 교재들에 대한 포스팅을 할게요 : )


  1. 이은정 2018.11.06 16:24

    3장 객관식 19번 관련해서 질문드립니다.
    알파랑 p-value 중에 답이 무엇인가요?
    책은 오히려 a에 가까운 설명이 나와있는 것 같아서요

    • 가이아쥐 2018.11.11 21:01 신고

      답변 늦게 드려 죄송해요. 우선 제가 나온 성적을 보면 정답은 p-value가 맞은거로 생각되는데 이게 공식 답변이 아니라 저도 제 점수로 유추만 한거라 ㅠㅠ 데이터에듀라는 사이트에 가답안을 올려놓는데 질문하기 부분에 보면 그곳에서도 p-value로 답이 나와있습니다 같이한번 확인해보시면 좋을것같아요^^

    • KENNY 2019.06.21 08:41

      답은 p-value가 맞습니다. 알파는 참인 귀무가설을 기각하는 1종오류를 범할 최대 확률이지 실제 확률은 아닙니다

  2. Goni 2018.11.18 19:10

    14번 문제는 유연성이 크면 bias는 높아지고 분산은 낮아지지 않나요????ㅠ
    오버핏은 분산이 높아지고 bias가 낮아지는거니까..

    • 가이아쥐 2018.11.19 13:55 신고

      유연성이 크려면 분산이 넓게 분포되어야한다고 하더라구요
      사실 편향은.. 정확히 모르겠습니다 ㅜㅜ 하지만 이게 답이라고들 하더라구요 상급의 변별력 문제여서 정확한 답을 알려주지 않아서 말씀드리가 어렵네요

    • Goni 2018.11.23 19:13

      http://bywords.tistory.com/m/entry/%EB%B2%88%EC%97%AD-%EC%9C%A0%EC%B9%98%EC%9B%90%EC%83%9D%EB%8F%84-%EC%9D%B4%ED%95%B4%ED%95%A0-%EC%88%98-%EC%9E%88%EB%8A%94-biasvariance-tradeoff

      여기 잘 설명되어 있습니다.
      준비하시는 분들 혼동이 없었으면 좋겠습니다!!:)

    • 가이아쥐 2018.11.25 05:15 신고

      알려주셔서 감사합니다 저도 한번 더 확실히 보게 되네요^^

  3. 1 2019.05.31 13:55

    20번 모든 회귀분석 결과표에서의 가정은 기울기가 0입니다. 따로 Beta=c(=상수)의 검정을 할 수는 있지만요!

+ Recent posts