[책] 데이터과학 입문 Doing Data Science
이 책으로 팀내 스터디 하기로 했다. 시작하기전, 책 전반에 대한 간단 요약.
‘데이터과학 입문’ 과목의 유래
이 과목을 제안한 이유
- 현업에서 데이터 과학자의 모습을 보여주고, 스킬을 일부 알려주고 싶음
- 데이터과학이 삶의 모든 측면에 영향을 미치는, 깊고 심오한 전공분야가 될 잠재력이 있다.
- 현업에 종사하는 데이터 과학자들로 부터, 강의실/대학환경에서는 데이터 과학을 가르칠수 없다는 말에 도전의식이 생김.
참고할 만한 곳
그치만 영어라 개인적으론 쉽지 않…ㅜㅡㅜ
책의 목표
- 묘사와 처방
- 데이터과학을한다는 것이 무엇인지 설명함으로써 데이터과학의 현주소 묘사
- 학문적 전공으로서 데이터 과학이 무엇이 될 수 있는지 처방
- 머신러닝 교재 아님
- 데이터과학에 대한 전체론적이고 인본주의적인 접근
책의 구성
- 데이터 과학이란 무엇인가?
- 2,3장 : 책 전체의 기초가되는 통계적 모형화와 기계학습 알고리즘
- 4,5,6,8 장 : 다양한 맥락에 따른 특정 모형과 알고리즘 사례
- 7장 : 데이터에서 어떻게 의미를 도출하고, 모형에 포함될 특징을 어떻게 만드는지.
- 9,10장 : 전통적으로 대학에서 가르치지 않는 데이터 시각화와 소셜네트워크
- 11,12 예측->인과성
- 13,14 : 데이터 준비와 공학
- 15장 데이터 과학을 학습한다는 것의 의미
- 16장 데이터 과학의 미래에 대해 우리가 희망하는 점
이 책을 읽는 방법
- 순차적으로 읽으면 좋다.
- 모르는 것은 좀더 조사해 가시길.
필요한 배경지식
- 선형대수, 확률, 통계
- 약간의 코딩 경험