데이터과학 입문
(구글,MS,이베이 데이터과학자에게 배우다)
저자 : 레이철 슈트, 캐시 오닐 지음
역자 : 윤영민, 허선, 전희주
출판사 : 한빛미디어 | 2014.11.03
Data Science! 데이터 과학은 이제 더 이상 생소한 단어, 학문이 아닙니다. 예전에는 데이터 과학을 통계학에 포함시켜 생각하기도 하였지만, 지금은 데이터 과학을 통계학과 분리한(분명 공통 분모는 있다 하여도..) 새로운 학문으로 발전시켜 나아가고 있는 추세입니다.
이 책은 컬럼비아 대학교 대학원의 데이터과학 입문 강의로 사용되어지는 책입니다. 말 그대로 입문서입니다. 총 16개의 장으로 되어 있어 16주 강의에 맞춰 진행하기에 좋은 책입니다.
아래 16개의 주제에 대해 확인해 보세요.
CHAPTER 1 소개: 데이터과학이란 무엇인가?
CHAPTER 2 통계적 추론, 탐색적 데이터분석과 데이터과학 과정
CHAPTER 3 알고리즘
CHAPTER 4 스팸 필터, 나이브베이즈, 경합
CHAPTER 5 로지스틱 회귀
CHAPTER 6 시간기록과 금융 모형화
CHAPTER 7 데이터에서 의미 추출하기
CHAPTER 8 추천 엔진: 대규모 사용자 대면 데이터 상품
CHAPTER 9 데이터 시각화와 사기 탐지
CHAPTER 10 소셜네트워크와 데이터 저널리즘
CHAPTER 11 인과성
CHAPTER 12 역학
CHAPTER 13 데이터경진대회의 교훈: 데이터 누출과 모형 평가
CHAPTER 14 데이터엔지니어링: 맵리듀스, 프리젤, 하둡
CHAPTER 15 수업에 대한 학생들의 소감
CHAPTER 16 차세대 데이터과학자, 교만, 그리고 윤리
이 책의 소제목에서 알 수 있듯이 구글, MS, 이베이 등 데이터과학자들이 여러 사례를 분석하고 직접 그 분석 시 사용했던 코드가 책에 수록되어 있습니다.
분명 위의 책은 컬럼비아 대학 등 다양한 해외 대학에서 입문용으로 사용되어 짐으로써 데이터 과학 입문용으로 사용해도 된다라고 검증이 된 것입니다.
하지만, 전 조심스럽게 여러분께 말씀드리고 싶습니다.
1. 아무것도 모른 상태에서 무작정 덤비지 말라.
: 분명 입문용이지만, 그 학문에 필요한 정말 기초적인 기반 지식이 필요함은 필수입니다. 위 책에서는 선형대수, 확률과 통계, 그리고 어느정도의 기초 프로그래밍 지식을 가지고 있는 사람들에게 더욱 쉽게 입문용으로 다가설 것이며 그렇지 않은 독자에게는 힘든 책이 될 수도 있습니다.
2. 필요한 부분만 찾아 익히자.
: 분명 이 책을 읽는 사람 중에 데이터 과학자가 아닌 S/W개발자들도 다수 있을 것 입니다. 저 또한 그렇습니다. 데이터 과학의 한 부분인 AI, 기계학습 등에 관심이 있었고, 공부하고 있는 사람으로써 한번 쯤 읽어보고 싶은 책인 것은 분명하지만, 제시된 코드는 분석을 위한 코드이며 시각화적인 측면으로 치우쳐져 있습니다. 실질적인 Core를 개발 및 검증을 위한 사람들에게는 100% 맞는 책이라고 추천 드리기 어렵습니다.
이 책을 읽으며 많은 것을 배웠지만, 그것을 100% 습득했다고는 말씀 드릴 수 없습니다. 제 역량이 부족한 것일 수도 있으며, 오랜 시간 투자하지 못하여 아직 이해를 못한 것일 수도 있습니다.
하지만, 이 책의 내용이 부족하여 학문의 깊이가 떨어진 것은 결코 아닙니다.
통계학자도, SW개발자도 아닌 바로 데이터과학자를 위한 책이기 때문이며 그 대상 독자를 위한 입문용으로는 현재 출간된 책들 중 굉장히 우수한 편이라고 말씀드릴수 있을 것 같습니다.
데이터 과학자로의 전공 이전을 고려 중인 통계학자, 수학자, 물리학자, 컴퓨터 엔지니어 등 누구든 좋습니다.
데이터 과학을 시작할려면 이 책으로 시작하세요!!
'Book' 카테고리의 다른 글
[Review] 후니의 쉽게 쓴 시스코 네트워킹 (0) | 2015.04.08 |
---|---|
[Review] 가장 쉬운 알고리즘 책 (1) | 2015.03.02 |
[Review] HTML5 & CSS 정복 (0) | 2014.11.27 |
[Review] 네트워크 더 쉽게, 더 깊게 (0) | 2014.11.27 |
[Review] TOPCODER 알고리즘 트레이닝 (0) | 2014.10.23 |