홈 > 부모님 > 부모님 > 소설,일반 > 컴퓨터,모바일
파이썬으로 배우는 데이터 과학  이미지

파이썬으로 배우는 데이터 과학
데이터 전처리부터 탐색적 분석, 데이터 시각화, 추론 및 예측까지
영진.com(영진닷컴) | 부모님 | 2025.12.10
  • 정가
  • 36,000원
  • 판매가
  • 32,400원 (10% 할인)
  • S포인트
  • 1,800P (5% 적립)
  • 상세정보
  • 18.8x25.7 | 1.322Kg | 696p
  • ISBN
  • 9788931481488
  • 배송비
  • 2만원 이상 구매시 무료배송 (제주 5만원 이상) ?
    배송비 안내
    전집 구매시
    주문하신 상품의 전집이 있는 경우 무료배송입니다.(전집 구매 또는 전집 + 단품 구매 시)
    단품(단행본, DVD, 음반, 완구) 구매시
    2만원 이상 구매시 무료배송이며, 2만원 미만일 경우 2,000원의 배송비가 부과됩니다.(제주도는 5만원이상 무료배송)
    무료배송으로 표기된 상품
    무료배송으로 표기된 상품일 경우 구매금액과 무관하게 무료 배송입니다.(도서, 산간지역 및 제주도는 제외)
  • 출고일
  • 1~2일 안에 출고됩니다. (영업일 기준) ?
    출고일 안내
    출고일 이란
    출고일은 주문하신 상품이 밀크북 물류센터 또는 해당업체에서 포장을 완료하고 고객님의 배송지로 발송하는 날짜이며, 재고의 여유가 충분할 경우 단축될 수 있습니다.
    당일 출고 기준
    재고가 있는 상품에 한하여 평일 오후3시 이전에 결제를 완료하시면 당일에 출고됩니다.
    재고 미보유 상품
    영업일 기준 업체배송상품은 통상 2일, 당사 물류센터에서 발송되는 경우 통상 3일 이내 출고되며, 재고확보가 일찍되면 출고일자가 단축될 수 있습니다.
    배송일시
    택배사 영업일 기준으로 출고일로부터 1~2일 이내 받으실 수 있으며, 도서, 산간, 제주도의 경우 지역에 따라 좀 더 길어질 수 있습니다.
    묶음 배송 상품(부피가 작은 단품류)의 출고일
    상품페이지에 묶음배송으로 표기된 상품은 당사 물류센터에서 출고가 되며, 이 때 출고일이 가장 늦은 상품을 기준으로 함께 출고됩니다.
  • 주문수량
  • ★★★★★
  • 0/5
리뷰 0
리뷰쓰기

구매문의 및 도서상담은 031-944-3966(매장)으로 문의해주세요.
매장전집은 전화 혹은 매장방문만 구입 가능합니다.

  • 도서 소개
  • 출판사 리뷰
  • 작가 소개
  • 목차
  • 회원 리뷰

  도서 소개

데이터 과학자로 시작하기 위한 이론과 실무 설명서!

이 책은 데이터 과학이 무엇인지 알려줍니다. 잠깐 생겼다가 사라지는 기술이 아닌 데이터 과학의 기본 구성 요소를 제공합니다. 데이터 과학의 한 부분만을 다루는 것이 아닌 데이터를 어떻게 해석하고 전체 주기를 따르면서 데이터 분석의 처음과 끝을 다룰 수 있게 도와주고 있습니다.

이 책은 6개의 부와 21개의 장으로 이루어져 있습니다.
1부 (1-5장)
1부는 데이터 과학 주기 전반을 기초적인 수준으로 훑어보면서 데이터 과학 주기에 대해서 설명
하고, 이 책 전반에서 사용하는 개념을 소개합니다. 이 부는 버스 도착 시간에 대한 짧은 예제로
마무리합니다.
2부 (6-7장)
2부에서는 데이터프레임과 데이터 간의 관계, 판다스(pandas)와 SQL을 사용해서 데이터를 다
루는 코드를 어떻게 작성하는지를 다룹니다.
3부 (8-12장)
3부는 데이터를 획득하고, 데이터의 특징을 탐색하고, 문제점을 찾아내는 것을 다룹니다. 이런
개념을 이해하고 나면, 데이터 파일을 가지고 데이터셋의 흥미로운 점을 발견하고 다른 사람들
에게 제시할 수 있을 것입니다. 이 부는 대기질에 대한 예제로 마무리합니다.
4부 (13-14장)
4부에서는 널리 사용되는 대안 데이터인 텍스트, 바이너리, 인터넷에서 가져오는 데이터에 대
해 살펴봅니다.
5부 (15-18장)
5부에서는 데이터를 사용해서 상황을 이해하는 법을 살펴봅니다. 여기서는 모델 적합, 피처 엔
지니어링, 모델 선택뿐만 아니라 가설 검정과 신뢰 구간 같은 추론 관련 주제도 다룹니다. 이
부의 말미에는 케냐의 수의사들이 당나귀 체중을 예측하는 것에 대한 예제를 다룹니다.
6부 (19-21장)
6부에서는 회귀 분석과 최적화를 사용한 지도 학습을 학습하며 이 책을 마무리합니다. 이 부의
끝에서는 뉴스 기사가 진짜인지 가짜인지 예측하는 예제를 다룹니다.

이 책의 부록에는 이 책에서 소개한 많은 주제에 대해서 더 학습하고자 할 때 필요한 자료와 이 책에서 사용한 데이터셋 목록을 추가했습니다.

【 대상 독자층 】
- 데이터 과학을 처음 배우는 대학생, 직장인
- 통계적 사고와 데이터 분석 실습을 배우고 싶은 사람
- 데이터 과학자의 분석 처리 방법을 단계별로 배워 보고 싶은 사람

  출판사 리뷰

이 책은 가장 기본적인 데이터 과학의 주기를 알려주는 것으로 시작합니다. 가장 기초적이면서도 가장 중요한 부분입니다. 데이터를 얻고, 이해하고, 상황을 이해하는 것은 데이터 과학자가 갖춰야 하는 기본적인 소양이라고 할 수 있습니다. 그리고 데이터를 아무리 많이 갖고 있더라도 제대로 된 질문이 없다면 데이터 분석에 의미가 없어집니다. 이 책은 실제 데이터를 다루면서 질문을 시작으로 어떻게 탐색할 수 있는지를 보여줍니다.
이론적으로 생각해야 할 전체적인 과정과 실제 데이터를 통해 어떻게 분석하고 예측할 수 있는지 설명하고 있어 데이터 과학자라면 꼭 필요한 내용을 배울 수 있었습니다.
이 책에 있는 분석 방법과 예제를 반복 학습해 보면서 데이터 과학자에 입문해 보시기 바랍니다.




  작가 소개

지은이 : 데보라 놀란
캘리포니아 버클리 대학교의 컴퓨터, 데이터 과학 및 사회 대학 (College of Computing, Data Science, and Society)의 통계학 명예 교수이자 학부 부학장으로, 재임 중 학부 교육학 관련 자파로니 가문 석좌교수 (Zaffaroni Family Chair)를 역임했습니다. 연구 분야는 경험적 과정, 고차원 모델링, 그리고 최근에는 교육 및 재현 가능한 연구 기술입니다. 데보라의 교육학적 접근 방식은 연구, 실습, 교육을 아우릅니다.

지은이 : 조셉 곤잘레스
캘리포니아 버클리 대학교(University of California, Berkeley)의 전자컴퓨터공학과 부교수이며 UC 버클리 RISE 연구실의 창립 멤버입니다. 연구 관심 분야는 기계 학습과 데이터 시스템이 교차하는 지점으로, 세부적으로는 전이 학습을 위한 동적 심층 신경망, 고해상도 컴퓨터 비전을 위한 가속화된 딥 러닝, 자율 주행 차량용 소프트웨어 플랫폼 등이 있습니다.

지은이 : 샘 라우
캘리포니아 대학교 샌디에이고(University of California, San Diego)의 할리시올루 데이터 과학 연구소(Halicio?lu Data Science Institute) 조교수입니다. 10년간의 교육 경험을 바탕으로 UC 버클리와 UC 샌디에이고에서 대표적인 데이터 과학 과정을 설계하고 가르치는 데 기여해 왔습니다.

  목차

1부 데이터 과학 주기
1장 데이터 과학 주기

1.1 데이터 과학 주기의 단계
1.2 데이터 과학 주기를 보여주는 예제
1.3 정리

2장 질문과 데이터 범위
2.1 빅데이터와 새로운 기회
2.2 대상 집단, 접근 프레임, 표본
2.3 수단 및 프로토콜
2.4 자연현상 측정
2.5 정확도
2.6 정리

3장 시뮬레이션과 데이터 설계
3.1 항아리 모델
3.2 예제: 선거 여론조사의 편향과 변동 시뮬레이션
3.3 예제: 백신 무작위 임상시험 시뮬레이션
3.4 예시: 대기질 측정
3.5 정리

4장 요약 통계량 모델링
4.1 상수 모델
4.2 손실 최소화
4.3 정리

5장 예제: 왜 내가 타는 버스는 맨날 늦을까?
5.1 질문과 범위
5.2 데이터 전처리
5.3 버스 시간 탐색
5.4 대기 시간 모델링
5.5 정리

2부 테이블 데이터
6장 Pandas를 사용한 데이터 프레임 다루기

6.1 나누기
6.2 집계
6.3 조인
6.4 변환
6.5 데이터 프레임은 다른 데이터 표현형과 어떻게 다를까?
6.6 정리

7장 SQL을 사용해서 관계형 데이터 다루기
7.1 나누기
7.2 집계
7.3 조인
7.4 변환과 공통 테이블 표현식(CTE)
7.5 정리

3부 데이터 이해
8장 파일 처리
8.1 데이터 예제
8.2 파일 형식
8.3 파일 인코딩
8.4 파일 크기
8.5 쉘과 명령어
8.6 테이블의 형태 및 구분 방식
8.7 정리

9장 데이터 프레임 전처리
9.1 예제: 마우나 로아 관측소에서의 CO_2 측정치 전처리
9.2 품질 확인
9.3 결측치와 기록
9.4 데이터 변환과 타임스탬프
9.5 구조 변경
9.6 예제: 식당 안전성 위반 사항 전처리
9.7 정리

10장 탐색적 데이터 분석
10.1 특성 유형
10.2 분포를 확인할 때
10.3 관계를 확인할 때
10.4 다변량 경우의 비교
10.5 탐색 시의 지침 사항
10.6 예제: 주택 거래가
10.7 정리

11장 데이터 시각화
11.1 구조 파악을 위한 축의 범위 선택
11.2 데이터 평활법과 집계
11.3 의미 있는 비교 유도하기
11.4 데이터 설계 통합
11.5 맥락 추가하기
11.6 plotly를 사용해서 그래프 그리기
11.7 그 외 시각화 도구
11.8 정리

12장 예제: 대기질 측정 내용은 얼마나 정확할까요?
12.1 질문, 설계, 범위
12.2 근처에 배치된 센서 찾기
12.3 AQS 센서 데이터 전처리
12.4 퍼플에어 센서 데이터 전처리
12.5 퍼플에어와 AQS 측정치 탐색
12.6 퍼플에어 측정치 보정을 위한 모델 생성
12.7 정리

4부 다른 유형의 데이터
13장 텍스트 다루기

13.1 텍스트와 처리 작업 예제
13.2 문자열 조작
13.3 정규표현식
13.4 텍스트 분석
13.5 정리

14장 데이터 교환
14.1 NetCDF 데이터
14.2 JSON 데이터
14.3 HTTP
14.4 REST
14.5 XML, HTML 및 XPath
14.6 정리

5부 선형 모델링
15장 선형 모델링

15.1 단순 선형 모델
15.2 예제: 대기질 측정을 위한 단순 선형 모델
15.3 단순 선형 모델 적합화
15.4 다중 선형 모델
15.5 다중 선형 모델 적합화
15.6 예제: 어디에 기회의 땅이 있습니까?
15.7 수치 측정치를 위한 특성 공학
15.8 범주형 측정치를 위한 특성 공학
15.9 정리

16장 모델 선택
16.1 과적합
16.2 훈련-테스트 분할
16.3 교차 검증
16.4 정규화
16.5 모델 편향 및 분산
16.6 정리

17장 추론 및 예측 이론
17.1 분포: 모집단, 경험치, 표본 추출
17.2 가설검정의 기본 사항
17.3 추론을 위한 부트스트랩
17.4 신뢰 구간의 기본 사항
17.5 예측 구간의 기본 사항
17.6 추론 및 예측을 위한 확률
17.7 정리

18장 예제: 당나귀의 체중을 재는 법
18.1 당나귀 연구의 질문 및 범위
18.2 전처리 및 변환
18.3 탐색
18.4 당나귀의 체중 모델링
18.5 정리

6부 분류
19장 분류

19.1 예제: 바람에 피해를 입은 나무
19.2 모델링 및 분류
19.3 비율(및 확률) 모델링
19.4 로지스틱 모델의 손실 함수
19.5 확률에서 분류로
19.6 정리

20장 수치 최적화
20.1 경사 하강법의 기본 사항
20.2 후버 손실 최소화하기(Minimizing Huber Loss)
20.3 볼록하고 미분 가능한 손실 함수
20.4 경사 하강법의 변형
20.5 정리

21장 예제: 가짜 뉴스 탐지
21.1 질문과 범위
21.2 데이터 수집 및 전처리
21.3 데이터 탐색
21.4 모델링
21.5 정리

부록 1 추가 자료
부록 2 데이터 원본

  회원리뷰

리뷰쓰기

    이 분야의 신상품