[리뷰] 이지패스 2021 빅데이터분석기사 필기



위키북스 출판사의 "이지패스 2021 빅데이터분석기사 필기(전용문, 정다혜, 임예은, 오경서 공저)"를 읽고 작성한 리뷰입니다.

표지


드디어 2020년 12월 19일 제1회 빅데이터분석기사 1차 시험이 시행된다. 4차 산업혁명과 알파고의 여파로 AI에 대한 열풍이 일고있는 현 시점에 AI 인재인지를 판가름하는 국가 기사 시험이기 때문에 AI 인재 여부를 얼마나 잘 가려내느냐에 대한 신뢰도를 떠나 AI 분야에 종사하고 싶은 이라면 기본으로 갖춰야 할 자격증으로 자리매김될 것 같다.

문제는 빅데이터분석기사 시험이 올해 처음으로 치뤄지기 때문에 어떤 교재로 학습을 해야하는지 공부는 어떤 분야를 어떤 수준으로 학습해야 하는지 감을 잡기가 어렵다는 것이다.

그나마 본 시험의 시행 기관인 한국데이터산업진흥원에서 본 시험과 유사한 ADP(데이터분석전문가) 자격 시험을 몇년 간 운영해왔기에 이와 유사한 학습 범위와 출제 기준이 적용될 것이라는 추측이 가능하다.

처음엔 ADP를 준비하고 싶은 마음이 있어 각종 응시후기를 읽고 복원 문제 및 교재를 학습해본 적이 있는데 취득 후 효용성이 떨어지고, 특히 시험 진행에 대한 진흥원 측의 운영 미숙 관련 각종 후기를 본 이후 응시할 마음을 접었다.

대신 빅데이터분석기사는 어쨌든 국가 공인 기사 시험이기 때문에 인재 변별력과 무관하게 형식적일지라도 반드시 취득해야 할테니 ADP는 접고 빅데이터분석기사를 치르기로 마음 먹었다.

하지만 빅데이터분석기사가 동 진흥원에서 치뤄진다는 확정 공고문을 본 이후로 마땅한 교재가 없어 그동안 ADP 공식 수험서를 구매하여 읽었다. 아마도 진행이 미숙한 진흥원 측에서 빅데이터분석기사를 위한 별도의 체계적인 준비가 잘 진행되고 있다고 보기 어려워 ADP ~ ADSP 중간 수준의 난이도로 그동안의 문제 은행을 활용하지 않을까 예상해본다.

진흥원에서 발간된 공식 수험서는 모르는 내용은 까다롭게 저술되어 가독성이 떨어지고, 아는 내용 조차 조악하게 기술되고 완급 조절이 없어 읽어야 할 내용은 많은데 핵심을 정리하기 어려운 구성으로 되어있다. 그럼에도 빅데이터분석기사 대비를 위한 마땅한 교재가 없어 최근 1년간 가벼운 마음으로 학습해왔다.

12월이 시험이니 3개월 전이면 슬슬 빅데이터분석기사에 대한 수험서가 나올거라 생각하여 서점을 둘러보기 시작했는데 현시점(2020년 11월말)까지 5종의 책이 등장했다.

그 중 2권은 제대로 읽었고 나머지는 전부 읽어본 것은 아니지만 서점에서 꽤 오랜시간 들춰본 후의 소감을 요약하면 다음과 같다.


  • 2020 빅데이터분석기사 필기 한권으로 끝내기(시x고시)
    가장 먼저 간행된 수험서라는 점에 의의를 둘 수 있겠으나, 구성이 조악하다. 일단 목차 구성부터 출제 기준 목록과 불일치 하는 경우가 많다. 그러다 보니 핵심을 파악하기 어렵고 메타지식을 파악하기 어려었다.

    물론 일부 분석기법 파트는 실전에 유용할만한 지식이 담겨있어 실무에 도움이 될 것 같은 부분도 보였으나, 수험서의 기준으로는 좋은 내용이라고 보기 어려웠다.

    연습문제가 많다는 것은 나름의 장점이지만 아직 1회도 치르지 않은 시험에 많은 문제로 승부수를 띄운 것은 위험한 선택이 될 수도 있다. 오타도 흔하게 발견되어 솔직히 가장 추천하고 싶지 않은 책이다.

  • 2021 최적합 빅데이터분석기사 필기(성x당)
    각 교재의 저자분들 중 가장 뛰어난 역량을 지닌 분들이 쓴 책이라는 점이 장점이다. 물론 저자의 수준과 전달력은 별개의 문제이지만 일단 저자의 약력에서 신뢰가 갔다. 더불어 앞서 소개한 책과 달리 진흥원에 공고된 출제범위와도 부합하여 정리하기 편해보였다.

    다만, 대학 강의노트 느낌의 개조식 서술 덕분에 요약 정리된 느낌인지라 어느 정도의 지식이 있는 이들에게는 깔끔한 느낌이 들 것 같긴한데 초보 수험생들에게는 이해하기 어려운 장벽으로 작용할 것 같다는 느낌이 들었다. 가독성 측면에서 매끄럽게 읽히지 않는 부분도 많다.

    더불어 단원별 연습 문제가 없으니 수험서로는 약간 부족한 느낌이었다.

  • 2021 수제비 빅데이터분석기사 필기(건x원)
    이 책은 직접 구매해서 2회독 중이다. 좋은 책들을 기다리다가 더 늦으면 안될 것 같아 결국 10월에 구매했는데 심도있는 부분의 설명이 부족한 것을 제외하면 대체로 무난하다. 특히 초보자들에게 추천하고 싶은 책이다.

    일단 쉽게 읽힌다는 점이 가장 장점인 책이다. 전체적인 구성이나 두음 비법 등의 독자들을 위한 장치들을 보며 수험생이 가급적 쉽고 편하게 공부할 수 있도록 친절한 배려가 돋보인다. 표와 그래프 위주로 핵심만 전달하고 있어 무작정 암기모드로 돌입하기에 적합한 구성이다. 대신 추후 실전에도 도움될만한 깊이있는 이해를 위해서는 부족한 느낌이다.

    예전부터 머신러닝 진영에 컴공 vs 통계학의 대립각이 있었는데 머신러닝이 융합 학문의 성격이 강해 저자가 어느 출신이냐에 따라 한 쪽이 부실하게 마련이다.

    나도 팔이 안으로 굽는 컴공 출신이지만 내 판단이 틀리지 않았다면 수제비 책 중 난이도가 어렵거나 통계에 해당되는 부분은 내용 오류도 제법 있고 설명이 부실하다. 저자분들이 IT 기술사 분들인지라 IT쪽은 튼튼한데 통계학은 약간 부실하다는 생각이 들었다.

    만약 빅데이터분석기사의 난이도가 매우 쉽게 출제된다면 본 도서의 저자의 의도가 적중했다고 볼 수 있을듯 하나, 약간 난이도가 높아진다면 이 수험서로는 부족할 듯 하다.

  • 2021 이기적 빅데이터분석기사 필기 기본서(영x닷컴)
    나온지 며칠 안된 책인지라 아직 서점에서 확인을 못했다. 기회가 되면 읽고 평해보겠다.

  • 이지패스 2021 빅데이터분석기사 필기(위x북스)
    바로 이 책이 본 포스팅에서 평해보려는 책이다. 이미 ADP 공식 교재를 학습해 왔던 터라 수제비 책만으로는 난이도 측면에서 약간 부족한 느낌이 들었기에 다른 책도 추가로 한 권 더 읽으며 공부하고 싶었는데 마침 기회가 닿아 이 책을 읽을 기회가 생겼다.

    이미 ADP 교재와 수제비 책으로 공부를 해왔기에 이 책을 빠르게 1회독 할 수 있었다. 읽으며 느꼈던 점을 장단점 위주로 정리해보려 한다.

    • 장점
      • 제대로 알고 있는 저자가 기술한 느낌이 든다.
        어떤 책을 읽다보면 정말 저자가 알고 작성한 글인지 의심이 들때가 있다. 물론 면면이 훌륭한 약력의 저자분들이기에 저자의 수준을 의심하긴 어렵겠지만 그래도 도통 무슨 소리인지 이해안되게 저술되는 경우가 있다.

        이 책을 읽으며 놀랐던 것은 짧은 글임에도 말하고자하는 핵심이 잘 전달되고, 도출까지의 과정이 상세히 녹아있어 이론을 충분히 아는 저자가 실무에서 겪었던 경험을 녹여 저술한 느낌이 들었다는 점이다.

        대표적으로 로지스틱 회귀나 p-value 설명 파트를 예를 들 수 있겠다. 이 부분들은 어떤 책을 읽어도 어렵고 모호한 용어가 난잡하게 등장하므로 한번에 이해하기 결코 쉽지 않다. 덕분에 빅데이터분석기사 책을 고를 때 좋은 기준이 되었는데 이 책의 로지스틱 회귀 부분을 읽다보면 수식이 없어도 수식이 보이고 설명은 짧아도 핵심은 놓치지 않는 느낌이 들었다.

        설명하기 어려운 부분을 잘 전달하고 있기에 일반적인 부분에 대한 가독성은 의심할 여지 없이 매끄러웠다. 전문 지식을 정확하게 이해하는 저자가 훌륭한 전달력을 갖고 저술했다고 볼 수 있다.

      • TIP 박스가 적중율을 예측하고, 핵심을 완급조절하는 느낌이다.
        정신없이 학습하다보면 강약에 대한 완급 조절을 실패할 때가 있다. 물론 일반 실무서라면 모두 필요한 내용이기에 언제고 활용되니 가치가 있겠지만 수험서는 제한된 시간 내 최대 점수를 획득해야 하는 입장이기에 완급 조절이 중요하다고 생각한다.

        이 책에는 TIP박스가 등장하는데 그 부분은 중요하다는 의미이다. 더불어 문제가 대충 어떤 식으로 나올 가능성이 있다고 알려준다. 아마도 내 예상이 맞다면 그동안 ADP 필기 시험 문제로 등장한 부분들마다 해당 TIP박스가 등장하는 것 같다.

        따라서 시간이 없는 분들은 TIP박스가 표시된 부분부터 읽는 것도 효율적인 방법이 될 수 있을 것 같다.

      • 연습문제의 질이 좋다. 확실히 학습하고 있는지 체크하는 계기
        ADP 실전문제집을 학습하며 조악한 암기식 문제의 나열에 실망한 적이 있었다. 이 책은 이런 단순 암기식 문제의 비율이 적은 편이다.

        예를 들면 SOM(자기조직화지도)에 대한 문제가 있는데 군집, 차원축소에 모두 사용될 수 있음을 확실히 알게 해준다.

        ADP 문제들을 보면 난이도가 높은 경우 두 영역의 기능을 포괄하는 기능들이 단골로 나오곤 하던데 이런 부분들을 놓치지 않게 구성한 점이 좋았다.

        또 하나 과적합을 예로 든다면 과소적합을 해결하기 위해 L1, L2 규제를 완화하면 모델이 복잡해진다는 일련의 매커니즘도 연습 문제를 풀며 정확하게 익힐 수 있게 해준다.

        더불어 라쏘(L1) norm을 구하는 등의 수학적 계산이 동반되는 문제도 자주 등장하기에 핵심 개념을 명확히 이해하고 있는지 수험생들의 수준을 잘 평가하는 느낌이 든다.

      • 가독성이 좋다.
        전체적으로 읽기 편한 줄글로 구성되어있다. 소설 책 읽어나가듯 술술 읽어나가기만 하면 된다. 너무 개조식 위주로 작성되어있으면 핵심은 눈에 명확히 들어올 지라도 끝없는 암기와의 싸움이 되기에 쉽게 지칠 수 있다. 이해를 동반한 암기만큼 암기를 쉽게 해주는 것도 없기에 그런 점에서 읽기 쉬운 책이라는 생각이 들었다.

      • ADP와 범용성
        ADP 공식 수험서로 빅데이터분석기사를 준비한 수험생 입장으로써 ADP를 단권화한 느낌이 든다. ADP 공식 교재는 기본서와 실전문제집으로 나뉘는데 공식 교재는 내용을 이해하기 어려운 부분이 많다. 대충 암기하고 넘어갈 수는 있으나 정확히 이해하며 넘기기 어려운 파트가 부분 부분 존재한다.

        그런 측면에서 ADP에서 이해하기 어려운 부분을 잘 풀어쓴 느낌이고 잘 이해되는 부분은 단권화하여 내용을 압축한 구성이 돋보인다. 위에서 언급했듯 강약 완급 조절을 위해 중요한 부분은 TIP 박스로 강조하며 실전문제집에 나오는 부분들 역시 TIP 박스로 강조되어있다.

        나아가 범용성이 뛰어난 것 같다. 특정 부분에 대한 집중적인 기술이나 설명 등의 편향 없이 고루 고루 적절한 분량으로 강조하고 있어 빅데이터분석기사 뿐만 아니라 다른 시험 혹은 나아가 실무에 있어서도 도움되는 지식들이 많다.

        딥러닝 위주로 연구, 학습하던 나로써는 부족한 부분을 이 수험서로 채울 수 있어 수험생의 입장이 아닌 실무자 입장으로도 가치있는 책이라는 생각이 들었다.

    • 단점
      • 핵심내용요약
        본문의 내용이 훌륭한 편인데 반해 핵심내용요약 파트는 약간 부실한 느낌이다.

        예를 들면 352p에 분석 모형의 종류가 정리되어있는데 로지스틱, DBSCAN 등 여러 모형이 나오지만 키워드만 다루고 있어 아쉬운 느낌이다. 알고리즘 별로 간단한 기능이 언급되고 시험에 자주 출제될 만한 어느 알고리즘이 비계층인지 등의 핵심포인트가 언급되어있다면 좋았겠다는 생각이든다. 더불어 SOM 같은 경우는 차원축소 기능으로도 활용될 수 있으나 군집 모형에서만 다루고 있어 이런 부분들이 약간 아쉽다.

      • 본문 - 핵심 - 연습문제의 범위 불일치
        가장 중요하다고 생각하는 3과목 빅데이터 모델링 파트를 예로 들면, 준지도 강화학습에 대한 설명이 본문에 존재하지 않는데 핵심내용요약에는 언급하고 있다. 이처럼 본문과 핵심내용이 상호 불일치 하는 경우가 조금씩 보인다.

        더불어 수제비 책의 경우 본문 자체가 핵심요약 같은 느낌이다. 물론 그로인해 상세한 본문 서술의 느낌이 없어 수제비 또한 이런 부분이 단점이라 하겠으나, 대신 암기식 위주의 효율성 측면에서는 손꼽힐 정도로 정리가 잘 되어있다.

        반면 본 도서의 경우 핵심요약이 본문의 굵직한 부분만 다루고 있어 핵심요약만으로 시험을 준비하기에는 부족하다는 생각이 들었다. 대신 본문의 내용이 튼튼하고 연습문제의 질이 좋기 때문에 여기서 배운 핵심내용요약 파트에 다루지 않는 내용들을 단권화 한다면 든든한 무기가 될 수 있을 것 같다.

      • 시험전략 등 부가적인 정보에 대한 부재
        전반적으로 빅데이터분석기사 학습에 필요한 내용은 잘 정리되어있으나 부수적인 시험장 전략이나 본 도서가 적중률을 위해 어떤 전략을 취했는지 가장 효율적으로 학습하기 위해선 어떻게 활용해야하는지 등의 전략이 추가되면 좋겠다.

        혹시나 싶어 네이버 카페를 찾아보니 [비전공자를 위한 빅분기 D-30] 한달 남은 빅분기 필기 어떻게 공부해야 할까?와 같은 읽어볼 만한 전략글들이 있었다.

        왜 이런 내용들이 책에는 실리지 않았는지 의문이지만 아마 급하게 출간되어서 그런것이 아닐까라는 생각에 개정판에는 이런 소소한 팁들도 반영되었으면 한다.

      • 실습코드의 부재
        필기 과목이기 때문에 이 부분은 그리 중요한 부분은 아닌 것 같다. 예를 들면 R이나 Python 같은 언어로 실습한 결과를 함께 보여준다면 이해에 많은 도움이 되었을 것 같다.

        하지만 그만큼 지면의 분량도 늘어날 것 같고 또 핵심을 쉽게 파악하기 어렵게끔 난잡한 느낌이 들 수 있겠다는 생각이 들어 나름의 트레이드 오프가 있을 듯 하다.


결론적으로 최근에 출시되어 정보가 없는 영x닷컴 책을 제외한다면, 위에서 언급한 4권의 책 중에서 가장 적합한 책이라는 생각이 든다. 위에서 언급한 대로 장점이 상당히 많은 반면, 단점은 대세에 큰 지장이 없는 미미한 정도에 불과하기 때문이다.

개인적으로 학습하던 수제비 책 수준이 너무 초보자 중심인지라 난이도 높은 부분을 잘 정리한 책이 필요했는데 이 책이 충분히 어려운 부분들을 이해하기 쉽게 깔끔하게 정리한 느낌이다.

우연찮게 네이버 카페 이벤트에 참여하게 되어 읽게 된 책이지만 과대 칭찬, 과장 혹은 비하 등 편향없이 리뷰를 작성하고자 노력했다. 어차피 내가 의도를 가지고 허위 진술을 한들 어느 정도 학습하신 분들은 오프라인 서점에서 책의 일부만 펼쳐봐도 내가 위에서 한 말들이 사실인지 아닌지 금방 검증하실 수 있을 것이다.

수험생들 모두 어떤 책이 제일 좋은지 관심사인지라 이런 비교글을 올리고 싶었는데 귀찮아서 안올리다가 이벤트 참여를 계기로 정리해본다.

이 글은 “빅데이터분석기사 필기” 수험서 서평단으로 선정되어 작성하였습니다.






© 2019.04. by theorydb

Powered by theorydb