
구매문의 및 도서상담은 031-944-3966(매장)으로 문의해주세요.
매장전집은 전화 혹은 매장방문만 구입 가능합니다.

지은이 : 데보라 놀란
캘리포니아 버클리 대학교의 컴퓨터, 데이터 과학 및 사회 대학 (College of Computing, Data Science, and Society)의 통계학 명예 교수이자 학부 부학장으로, 재임 중 학부 교육학 관련 자파로니 가문 석좌교수 (Zaffaroni Family Chair)를 역임했습니다. 연구 분야는 경험적 과정, 고차원 모델링, 그리고 최근에는 교육 및 재현 가능한 연구 기술입니다. 데보라의 교육학적 접근 방식은 연구, 실습, 교육을 아우릅니다.
지은이 : 조셉 곤잘레스
캘리포니아 버클리 대학교(University of California, Berkeley)의 전자컴퓨터공학과 부교수이며 UC 버클리 RISE 연구실의 창립 멤버입니다. 연구 관심 분야는 기계 학습과 데이터 시스템이 교차하는 지점으로, 세부적으로는 전이 학습을 위한 동적 심층 신경망, 고해상도 컴퓨터 비전을 위한 가속화된 딥 러닝, 자율 주행 차량용 소프트웨어 플랫폼 등이 있습니다.
지은이 : 샘 라우
캘리포니아 대학교 샌디에이고(University of California, San Diego)의 할리시올루 데이터 과학 연구소(Halicio?lu Data Science Institute) 조교수입니다. 10년간의 교육 경험을 바탕으로 UC 버클리와 UC 샌디에이고에서 대표적인 데이터 과학 과정을 설계하고 가르치는 데 기여해 왔습니다.
1부 데이터 과학 주기
1장 데이터 과학 주기
1.1 데이터 과학 주기의 단계
1.2 데이터 과학 주기를 보여주는 예제
1.3 정리
2장 질문과 데이터 범위
2.1 빅데이터와 새로운 기회
2.2 대상 집단, 접근 프레임, 표본
2.3 수단 및 프로토콜
2.4 자연현상 측정
2.5 정확도
2.6 정리
3장 시뮬레이션과 데이터 설계
3.1 항아리 모델
3.2 예제: 선거 여론조사의 편향과 변동 시뮬레이션
3.3 예제: 백신 무작위 임상시험 시뮬레이션
3.4 예시: 대기질 측정
3.5 정리
4장 요약 통계량 모델링
4.1 상수 모델
4.2 손실 최소화
4.3 정리
5장 예제: 왜 내가 타는 버스는 맨날 늦을까?
5.1 질문과 범위
5.2 데이터 전처리
5.3 버스 시간 탐색
5.4 대기 시간 모델링
5.5 정리
2부 테이블 데이터
6장 Pandas를 사용한 데이터 프레임 다루기
6.1 나누기
6.2 집계
6.3 조인
6.4 변환
6.5 데이터 프레임은 다른 데이터 표현형과 어떻게 다를까?
6.6 정리
7장 SQL을 사용해서 관계형 데이터 다루기
7.1 나누기
7.2 집계
7.3 조인
7.4 변환과 공통 테이블 표현식(CTE)
7.5 정리
3부 데이터 이해
8장 파일 처리
8.1 데이터 예제
8.2 파일 형식
8.3 파일 인코딩
8.4 파일 크기
8.5 쉘과 명령어
8.6 테이블의 형태 및 구분 방식
8.7 정리
9장 데이터 프레임 전처리
9.1 예제: 마우나 로아 관측소에서의 CO_2 측정치 전처리
9.2 품질 확인
9.3 결측치와 기록
9.4 데이터 변환과 타임스탬프
9.5 구조 변경
9.6 예제: 식당 안전성 위반 사항 전처리
9.7 정리
10장 탐색적 데이터 분석
10.1 특성 유형
10.2 분포를 확인할 때
10.3 관계를 확인할 때
10.4 다변량 경우의 비교
10.5 탐색 시의 지침 사항
10.6 예제: 주택 거래가
10.7 정리
11장 데이터 시각화
11.1 구조 파악을 위한 축의 범위 선택
11.2 데이터 평활법과 집계
11.3 의미 있는 비교 유도하기
11.4 데이터 설계 통합
11.5 맥락 추가하기
11.6 plotly를 사용해서 그래프 그리기
11.7 그 외 시각화 도구
11.8 정리
12장 예제: 대기질 측정 내용은 얼마나 정확할까요?
12.1 질문, 설계, 범위
12.2 근처에 배치된 센서 찾기
12.3 AQS 센서 데이터 전처리
12.4 퍼플에어 센서 데이터 전처리
12.5 퍼플에어와 AQS 측정치 탐색
12.6 퍼플에어 측정치 보정을 위한 모델 생성
12.7 정리
4부 다른 유형의 데이터
13장 텍스트 다루기
13.1 텍스트와 처리 작업 예제
13.2 문자열 조작
13.3 정규표현식
13.4 텍스트 분석
13.5 정리
14장 데이터 교환
14.1 NetCDF 데이터
14.2 JSON 데이터
14.3 HTTP
14.4 REST
14.5 XML, HTML 및 XPath
14.6 정리
5부 선형 모델링
15장 선형 모델링
15.1 단순 선형 모델
15.2 예제: 대기질 측정을 위한 단순 선형 모델
15.3 단순 선형 모델 적합화
15.4 다중 선형 모델
15.5 다중 선형 모델 적합화
15.6 예제: 어디에 기회의 땅이 있습니까?
15.7 수치 측정치를 위한 특성 공학
15.8 범주형 측정치를 위한 특성 공학
15.9 정리
16장 모델 선택
16.1 과적합
16.2 훈련-테스트 분할
16.3 교차 검증
16.4 정규화
16.5 모델 편향 및 분산
16.6 정리
17장 추론 및 예측 이론
17.1 분포: 모집단, 경험치, 표본 추출
17.2 가설검정의 기본 사항
17.3 추론을 위한 부트스트랩
17.4 신뢰 구간의 기본 사항
17.5 예측 구간의 기본 사항
17.6 추론 및 예측을 위한 확률
17.7 정리
18장 예제: 당나귀의 체중을 재는 법
18.1 당나귀 연구의 질문 및 범위
18.2 전처리 및 변환
18.3 탐색
18.4 당나귀의 체중 모델링
18.5 정리
6부 분류
19장 분류
19.1 예제: 바람에 피해를 입은 나무
19.2 모델링 및 분류
19.3 비율(및 확률) 모델링
19.4 로지스틱 모델의 손실 함수
19.5 확률에서 분류로
19.6 정리
20장 수치 최적화
20.1 경사 하강법의 기본 사항
20.2 후버 손실 최소화하기(Minimizing Huber Loss)
20.3 볼록하고 미분 가능한 손실 함수
20.4 경사 하강법의 변형
20.5 정리
21장 예제: 가짜 뉴스 탐지
21.1 질문과 범위
21.2 데이터 수집 및 전처리
21.3 데이터 탐색
21.4 모델링
21.5 정리
부록 1 추가 자료
부록 2 데이터 원본
도서 DB 제공 - 알라딘 인터넷서점 (www.aladin.co.kr)