KPI뉴스 - 한권으로 데이터 사이언스 입문 A to Z

  • 비포항19.5℃
  • 흐림보성군20.3℃
  • 구름많음홍성18.3℃
  • 구름많음군산20.0℃
  • 구름많음구미20.5℃
  • 구름많음영주18.4℃
  • 구름많음경주시19.0℃
  • 흐림동해18.3℃
  • 구름많음문경18.7℃
  • 구름많음양산시20.8℃
  • 맑음속초16.2℃
  • 구름많음창원20.8℃
  • 맑음강화17.1℃
  • 구름많음영광군20.2℃
  • 흐림부산20.0℃
  • 구름많음임실18.4℃
  • 구름많음천안20.1℃
  • 구름많음산청18.0℃
  • 흐림장흥20.3℃
  • 구름많음상주19.7℃
  • 흐림정선군15.9℃
  • 맑음인천21.4℃
  • 구름많음북부산21.3℃
  • 구름많음부안19.2℃
  • 맑음양평20.1℃
  • 흐림흑산도20.2℃
  • 비울산18.8℃
  • 흐림거제19.0℃
  • 구름많음고창군20.1℃
  • 흐림해남20.4℃
  • 구름많음순천17.5℃
  • 흐림북강릉17.6℃
  • 구름많음광양시21.0℃
  • 구름많음장수15.9℃
  • 구름많음영천19.9℃
  • 구름많음안동19.6℃
  • 구름많음부여19.2℃
  • 구름많음백령도18.2℃
  • 흐림제천18.1℃
  • 구름많음밀양21.6℃
  • 구름많음서산19.2℃
  • 흐림통영20.1℃
  • 흐림청주21.6℃
  • 구름많음완도20.7℃
  • 구름많음추풍령18.3℃
  • 구름많음보령19.9℃
  • 맑음울진19.0℃
  • 맑음서울21.2℃
  • 구름많음충주20.2℃
  • 구름많음금산19.1℃
  • 구름많음울릉도18.8℃
  • 구름많음고창19.8℃
  • 구름많음보은19.4℃
  • 구름많음광주20.5℃
  • 흐림대관령13.5℃
  • 맑음파주18.1℃
  • 흐림봉화18.4℃
  • 구름많음진주19.1℃
  • 흐림영월18.2℃
  • 흐림여수20.6℃
  • 구름많음정읍19.9℃
  • 맑음북춘천17.6℃
  • 구름많음대구19.7℃
  • 구름많음대전20.3℃
  • 구름많음전주20.4℃
  • 구름많음의성20.2℃
  • 구름많음고산19.7℃
  • 흐림진도군20.6℃
  • 구름많음영덕18.3℃
  • 구름많음김해시20.3℃
  • 구름많음합천20.3℃
  • 맑음이천19.8℃
  • 맑음철원16.6℃
  • 구름많음청송군18.3℃
  • 구름많음거창18.1℃
  • 구름많음서청주20.4℃
  • 구름많음의령군19.8℃
  • 구름많음목포20.6℃
  • 흐림남해19.8℃
  • 흐림강릉17.8℃
  • 구름많음세종20.1℃
  • 맑음동두천18.5℃
  • 흐림고흥20.4℃
  • 맑음춘천17.5℃
  • 비제주19.6℃
  • 흐림강진군20.4℃
  • 구름많음성산20.6℃
  • 구름많음함양군18.3℃
  • 맑음태백14.7℃
  • 구름많음순창군19.4℃
  • 흐림원주19.3℃
  • 구름많음남원20.0℃
  • 흐림서귀포21.9℃
  • 구름많음북창원20.2℃
  • 맑음수원21.1℃
  • 맑음인제15.4℃
  • 맑음홍천17.8℃

한권으로 데이터 사이언스 입문 A to Z

김들풀
기사승인 : 2019-12-27 16:09:35
반드시 알아야 할 수학과 파이썬 데이터분석
가장 쉽고 빠르게, 제대로 배우는 데이터 사이언스 입문서
4차 산업혁명에서 핵심 기술인 데이터 사이언스와 머신 러닝이 일반화된 지금, 다양한 머신 러닝과 딥 러닝을 데이터에 적용하는 것은 그리 어렵지 않은 일이 됐다.

데이터 사이언스에서 가장 중요한 것은 데이터 그 자체다. 하지만 현장에서는 데이터 처리 기술에만 집중하고 있다.

특히 데이터 수집 과정에서 수많은 오류를 포함하게 되는 경우를 자주 본다. 따라서 데이터 전처리(Data pre-processing)는 데이터 사이언스에서 매우 중요한 과정이다.

빅 데이터를 다루는 많은 사람에게 있어 데이터 자체가 지니고 있는 오류를 발견해 보정해줘야 한다. 이후 모델이 수립되면 로우 데이터(Raw Data)를 들여다보고 그 의미와 해석에 대해 서로 연결해나갈 수 있는 실력이 있어야 한다.

사회적으로 데이터를 분석하는 전문가에 대한 수요는 급증하고 있다. 하지만 이 분야에 뛰어난 분석력과 창의적인 인재가 부족한 것이 현실이다.

새 책 '데이터 사이언스 입문 A to Z'는 그런 부분을 중점을 두고 집필했다.

이 책은 데이터 분석을 위한 기본서다. 즉 4차 산업혁명에서 꼭 필요한 데이터분석에 대한 내용을 다룬 교재다.

데이터 전문가를 양성하는 데 있어서 꼭 필요한 내용으로 엮어져 있다. 데이터 전문가로 성장하는데 필요한 기초적인 모든 내용을 포괄적으로 다루고 있다.

이 책은 파이썬의 수학 라이브러리인 넘피(numpy)를 비롯해 데이터 통계 라이브러리인 판다스(pandas), 맷플랍립(matplotlib) 등에 관한 설명과 예제들이 가득한 책이다. 금융 데이터 분석, 공공데이터 분석 등을 처리하는 예제들을 통해 실제 데이터 분석 활용법을 알려주는 책이다.

또한 가장 기본적인 처리를 기준으로 꼭 필요한 것을 하나로 연결해서 더 쉽게 접근할 수 있도록 묶었다.

데이터를 분석하려면 숫자를 관리하는 배열 형태의 자료구조를 알아야 한다. 넘파이와 판다스 모듈의 배열 개념을 이해하고, 배열 내의 원소를 계산하는 선형대수 처리 방식을 배울 수 있다.

다시 말해 머신러닝과 딥러닝의 알고리즘을 잘 사용하는 것도 중요하지만 데이터가 왜 이런 결과로 만들어졌는지 그 원리를 정확히 파악하는 것이 중요하다.

이 책은 각종 데이터분석부터 자연어의 기본까지 데이터 사이언스에서 필요한 대부분의 내용들을 다루고 있다.

<한권으로 파이썬 데이터 사이언스 입문 AtoZ>|저자 문용준, 문성혁|도서출판 잇플ITPLE

KPI뉴스 / 김들풀 IT과학 전문기자 itnews@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]