Hits

공부 과정

죽어라 빅데이터 분석기사 필기 공부를 했다.

비전공자로써 내가 그래도 어느 정도 이론만큼은 알고 있다는 것을 증명하기 위해 이 자격증을 준비했었다. 대략적인 공부 기간은 두 달이었고, 하루에 최소 네 시간에서 여섯 시간씩은 책을 읽고 문제를 풀었다. 공부양은… 음… 이기적 책 7회독 정도 한거 같고(책이 걸레짝이 됬다.), 어느정도 숙지한 후에는 이기적 책에 그리 믿음이 가지 않아 빅데이터 분석기사 700 문제집을 2회독 더 했다.

기상 -> 수험서 읽기 -> 수험서 과목별로 정리 -> 문제 풀이 -> 틀린 문제 다시 풀기 -> 자투리시간 코딩하기 (실기 대비) 순으로 하루를 썼다.

본인은 암기하는걸 무지무지하게 싫어해서 책을 보고 또 보며 용어를 장기기억하려고 했다.

다른 분들에게 드리는 팁은… 이 시험이 아무리 필기라도 직접 통계나 기계학습을 선행학습으로 코딩해보면 어떤게 중요한지 알 수 있고, 처음보는 부분도 어렴풋이 이해할 수 있게 될 것이다. 이상하게 빅데이터 분석 기사의 경우 생판 처음 보는 부분도 단어를 이해하기만 하면 대략 어떤 건지 감이 오는 경우가 있다.


시험 후기

본인은 서울 상계동에 있는 한 고등학교에서 시험을 봤는데, 시험 환경은 좋았다고 생각한다. 일단 감독관 분들이 융통성 있게 시험 감독을 잘 해 주셨고, 방역에도 힘을 쓰신 것 같았다. 밖에서 산책하는 아저씨가 손바닥 치며 소리질러서 그것만 좀 불편했지만 ㅎ…

전반적으로 시험 난이도는 중상 정도라 생각한다. 요약하자면.. (실전 + 이론)이다. 사람을 당황스럽게 하는 문제들이 많았는데 이성을 되찾고 문제를 다시 보면 풀린다. 또한 모르는 용어들이 많이 나왔다. 그리고 이기적 책은 적중률 매우 안좋았다!!!!!!! 책 두 개 사길 잘했다. 과목별로 체감 난이도를 작성해본다면

1 과목

: 이기적 책에서 나온다고 했던 거 많이 안나왔다. 오히려 ‘‘빅데이터 분석 기사 문제집 700’이 더 적중률이 좋았다. 일단 1과목은 본인이 처음 보는 생소한 용어들이 많았다. 섭동?? 이런 것들.. 그래서 깨달은게 책에 있는 대로 공부하지 말고 직접 구글링을 하며 관련 지식을 쌓아야 한다는 것이었다. 책에서 CRISP/DM 분석방법론 절차 이런거 엄청 외웠었는데 하나도 안나왔고, 오히려 내가 구글링해서 알아본 라쏘회귀모델은 시험에서 출제됬었다. 하둡 스파크 이런건 하나도 안 나왔다 ㅠ
기억나는 문제로는 ETL(추출 변환 적재), 개인정보 어느 상황에 동의 구하는게 틀리는지, 데이터베이스를 크롤링 가능?, API, ftp 가 있다. 문제가 대체적으로 공을 많이 들였던 것 같다고 생각했다.

2과목

2과목 풀 때쯤엔 주변 사람들의 한숨소리가 제일 많이 들렸다. 계산기를 사용 불가래서 계산 문제가 없나 생각했었는데, 다시 생각해보니 뭔가 꺼림칙해서 계산 문제 준비를 했긴 했었었다. 근데 설마 통계문제가 이렇게 많이 나올 줄이야.. 가설검정, 제2종 오류 확률 구하기, 베이즈 추론, 미분 활용한 최대 우도법, 모분산 모를때 신뢰구간까지 나를 당황시키는 장문의 계산문제가 그때는 벽처럼 느껴졌었다. 그래서 미리 전략 짜온대로 맨 나중에 풀었다. 다른 분들에게도 이 전략 추천한다. 처음 볼 땐 죽어라 외웠던 공식이 죄다 기억이 안나서 상당히 당황했었다. 4과목까지 다 풀고 30분쯤 남았을 때 계산하는 5문제들을 풀었었다. 약간… 코딩하듯이 단계적으로 풀면 풀리긴 풀리더라… 최대우도법은 그냥 찍었다 ㅠ

3과목

2과목 풀다가 3과목에 와서 그런지 체감난이도는 낮았다. 처음에 공부할 때도 3과목이 너무 어려워서 다른 과목보다 시간을 더 쏟았던 기억이 난다. 기계학습의 경우 책만 읽지 말고 직접 코딩을 해보는 것을 추천드린다. 나왔던 문제는 하이퍼 파라미터, 앙상블 기법 계산하기, 잔차, 주성분분석, 차원의 저주와 거리, 분류, CNN, 스트라이드 이런 것들이 나왔다. 3과목 같은 경우 문제 하나하나를 자기자신이 평가하듯이 꼼꼼히 보는 것을 추천드린다.

4과목

의외로 시각화와 관련한 문제가 많이 안나왔던 것으로 기억한다. 이기적 책에서는 비교시각화, 관계시각화, 분포시각화 등등 에 따른 여러 그래프들을 보여주고 외우라고 했는데, 그런 문제들 2개밖에 안나왔다. 오히려 난이도를 높여 시계열 (백색소음 모델이 있을까 없을까, 박스 그림은 분산을 구할 수 있을까 없을까, 스타차트는 축이 두 개일까 아닐까, ) 이런 문제들이 나왔고, 또한 함정이 있는 문제들도 많았다. 예를 들어 시각화한 그래프 축과 범례를 꼼꼼히 보지 않으면 틀릴 수 밖에 없는 문제들이 나왔다. 비교적 쉬운 과목이고 마지막 과목이라고 방심하지 말고 시험 다보고 문제를 한번이라도 다시 보길 추천드린다.

본인은 음… 시험보고 나서 좀 찝찝했다. 문제들이 함정이 많았고 시험장도 5분 정도 남기고 나갔다. 그래서 턱걸이로 붙던지 떨어질 것 같다는 생각이 들었다. 불합격하면 다시 공부해야겠다 ^^ 그동안 다른 코딩 연습도 더 하고 실력 키우면 붙겠지~ 긴글 읽어주신분들 감사드린다.

앞으로 기계학습 책 공부하고 이곳에 정리할테니 가끔씩 들러주셨으면 좋겠다~