모두의 R 데이터 분석
초보자와 비전공자를 위한 가장 쉬운 R 데이터 분석 입문서!
데이터 셰프가 되어 데이터를 요리해 보자!
데이터 분석은 어떻게 하는 걸까? R을 전혀 모르는데 가능할까? 책에서는 데이터 분석 과정을 ①데이터를 처리하고 ②그려 보며 ③이해하는 흐름으로 정리하며, 각 과정을 요리하는 과정에 비유하여 설명한다. 또한, R과 RStudio 설치법부터 시작해 전작 『모두의 SQL』처럼 비전공 실무자가 가장 많이 사용하는 R 핵심 내용만 다루며, 130개 일러스트와 간결한 설명으로 직관적으로 이해할 수 있다. 특히 마지막 장에서는 가상의 비즈니스 데이터로 ‘패밀리 레스토랑’의 ‘멤버십 기획 프로젝트’를 진행하면서 실제 데이터 분석 과정을 경험한다. R로 데이터 분석을 처음 시작하려는 모든 사람에게 추천하며, 이 책으로 데이터 셰프가 되어 데이터를 직접 요리해 보자!
전자책 구입
목차
- 1장 데이터 분석과 요리
- UNIT 01 처리하고 그려 보며 이해하기
- UNIT 02 데이터 분석 = 맛있는 요리하기
- UNIT 03 정리
- 2장 R 알아보기
- UNIT 01 R이란
- 1 R의 특징
- 2 R의 활용 분야
- UNIT 02 R과 비슷한 분석 프로그램들
- 1 엑셀
- 2 파이썬
- 3 SQL
- UNIT 03 R과 데이터 마이닝
- 1 데이터 마이닝을 활용하는 산업 분야
- 2 기업에서는 비즈니스 데이터를 어떻게 활용할까?
- UNIT 04 정리
- 3장 R 설치 및 기본 사용 방법 익히기
- UNIT 01 R 설치
- UNIT 02 RStudio 설치
- UNIT 03 RStudio와 R의 기본 사용 방법 이해
- 1 주요 화면과 기능
- 2 소스 창
- 3 콘솔 창
- 4 환경 창
- 5 파일 창
- 6 R 기본 개념과 사용 방법
- 7 R 프로젝트 생성
- 8 R 스크립트를 작성하고 저장하기
- 9 옵션 설정하기
- 10 주요 단축키
- UNIT 04 정리
- 4장 요리 재료 특성 알기: 데이터의 종류, 구조, 형태
- UNIT 01 데이터 종류
- 1 숫자형
- 2 문자형
- 3 날짜형
- 4 논리형
- 5 그 외 데이터 표현
- UNIT 02 데이터 구조
- 1 벡터
- 2 벡터 구조에서 데이터 선택하기
- 3 팩터
- 4 팩터 구조에서 데이터 선택하기
- 5 행렬
- 6 행렬 구조에서 데이터 선택하기
- 7 배열
- 8 배열 구조에서 데이터 선택하기
- 9 리스트
- 10 리스트 구조에서 데이터 선택하기
- 11 데이터 프레임
- 12 데이터 프레임 구조에서 데이터 선택하기
- UNIT 03 데이터 형태
- UNIT 04 정리
- 5장 요리 도구 준비: 변수와 함수, 그리고 패키지
- UNIT 01 변수: 요리 그릇
- 1 변수란
- 2 변수에 데이터 할당하기
- 3 변수 이름 짓기
- UNIT 02 함수: 요리 도구
- 1 함수란
- UNIT 03 패키지: 요리 도구 세트
- 1 패키지란
- 2 패키지 설치하기
- 3 패키지 로드하고 사용하기
- 4 패키지 업데이트와 삭제하기
- UNIT 04 정리
- 6장 기초 요리법 익히기: R 연산자와 함수
- UNIT 01 R 연산자와 함수
- UNIT 02 연산자
- 1 할당 연산자와 벡터 연산하기
- 2 산술 연산자
- 3 비교 연산자
- 4 논리 연산자
- UNIT 03 데이터 가져오기와 내보내기
- 1 read.csv( )와 read.excel( ): 데이터 가져오기
- 2 write.csv( )와 write_excel( ) 함수: 데이터 내보내기
- 3 sink( ) 함수: 분석 결괏값 저장하기
- 4 save( )와 load( ) 함수
- UNIT 04 데이터 확인
- 1 head( )와 tail( ) 함수: 데이터 앞부분과 끝부분 확인하기
- 2 str( ) 함수: 데이터셋 구조 확인하기
- 3 View( ) 함수: 데이터셋 창을 띄워 확인하기
- 4 dim( ), nrow( ), ncol( ) 함수: 데이터 차원, 행, 열 확인하기
- 5 length( ) 함수: 데이터 길이 세기
- 6 ls( ) 함수: 변수 목록 확인하기
- 7 object.size( ) 함수: 변수 크기 확인하기
- 8 데이터의 자료형과 데이터 구조를 확인하는 함수들
- UNIT 05 데이터 조작
- 1 rbind( )와 cbind( ) 함수: 행끼리, 열끼리 묶기
- 2 split( ) 함수: 팩터 열로 나누기
- 3 subset( ) 함수: 조건으로 데이터 선택하기
- 4 substr( ) 함수: 지정한 자리만큼 문자열 선택하기
- 5 merge( ) 함수: 데이터 프레임 합치기
- 6 sort( )와 order( ) 함수
- 7 unique( ) 함수: 유일 값 반환하기
- 8 Rm( ) 함수: 변수 제거하기
- 9 aggregate( ) 함수: 그룹별로 통계 적용하기
- 10 apply( ) 계열 함수: 조건으로 함수 적용하기
- 11 as.~ 계열 함수: 형 변환 함수
- UNIT 06 데이터 계산
- UNIT 07 데이터 그리기
- 1 plot( ) 함수: 산점도 그리기
- 2 pairs( ) 함수: 행렬 산점도 그리기
- 3 hist( ) 함수: 히스토그램 그리기
- 4 barplot( ): 막대 그래프 그리기
- 5 pie( ) 함수: 파이 차트 그리기
- 6 plot( ) 함수 o 옵션: 선 그래프 그리기
- 7 boxplot( ) 함수: 상자 그림 그리기
- UNIT 08 그 외 반복문과 사용자 정의 함수
- 1 조건문
- 2 반복문
- UNIT 09 정리
- 잠깐만요 필독! 7~9장 비즈니스 데이터 실습을 하기 전 사전 작업
- 1. 작업 환경 만들기: 새로운 프로젝트 만들기
- 2. 실습용 데이터 가져오기
- 7장 재료 다루는 법 익히기: 데이터 처리를 위한 dplyr 패키지
- UNIT 01 dplyr 패키지 설치와 파이프 연산자
- 1 dplyr 패키지 설치하기
- 2 파이프 연산자(%>%): 데이터 전달하기
- UNIT 02 행 요약과 그룹화
- 1 summarise( ) 함수: 행 요약하기
- 2 group_by( ) 함수: 행 그룹화하기
- UNIT 03 행 조작
- 1 filter( ) 함수: 조건으로 행 선택하기
- 2 distinct( ) 함수: 유일 값 행 선택하기
- 3 slice( ) 함수: 선택 행 자르기
- 4 arrange( ) 함수: 행 정렬하기
- 5 add_row( ) 함수: 행 추가하기
- 6 sample_frac( ), sample_n( ) 함수: 무작위로 샘플 행 뽑기
- UNIT 04 열 조작
- 1 select( ) 함수: 열 선택하기
- 2 mutate( ) 함수: 열 조작해서 새로운 열 생성하기
- 3 transmute( ) 함수: 원래 열 빼고 새로운 열 생성하기
- 4 mutate_all( ) 함수: 모든 열 조작해서 새로운 열 생성하기
- 5 mutate_if( ) 함수: 특정 조건 열만 조작해서 새로운 열 생성하기
- 6 mutate_at( ) 함수: 특정 열만 조작해서 새로운 열 생성하기
- 7 rename( ) 함수: 열 이름 바꾸기
- UNIT 05 테이블 조작
- 1 bind_cols( ) 함수: 테이블 열 붙이기
- 2 bind_rows( ) 함수: 테이블 행 붙이기
- 3 inner_join( ) 함수: 일치하는 데이터 연결하기
- 4 left_join( ) 함수: 왼쪽 기준 모든 데이터 연결하기
- 5 right_join( ) 함수: 오른쪽 기준 모든 데이터 연결하기
- 6 full_join( ) 함수: 양쪽 모든 데이터 연결하기
- 7 intersect( ) 함수: 데이터 교집합 구하기
- 8 setdiff( ) 함수: 데이터 빼기
- 9 union( ) 함수: 중복을 제거해서 데이터 합치기
- UNIT 06 dplyr 패키지 함수를 잘 사용하는 법
- UNIT 07 정리
- 8장 데커레이션 익히기: 데이터 그리기, ggplot2 패키지
- UNIT 01 ggplot2 패키지
- UNIT 02 ggplot2 패키지 설치와 기본 문법
- 1 ggplot2 패키지 설치하기
- 2 ggplot2 기본 문법
- UNIT 03 산점도: 흩어진 정도 확인
- 1 산점도 데이터 준비하기
- 2 산점도 그래프 그리기
- 3 산점도 그래프에 색상 적용하기
- UNIT 04 막대 그래프: 데이터 크기 비교
- 1 막대 그래프 데이터 준비하기
- 2 막대 그래프 그리기
- 3 막대 그래프 순서 정렬하기
- 4 자동으로 막대 그래프에 색상 채우기
- 5 막대 그래프 일부만 선택하기
- 6 가로 막대 그래프 그리기
- 7 범례 조정하기
- UNIT 05 히스토그램: 도수 분포 확인
- 1 히스토그램 타이틀과 축 제목 변경하기
- 2 theme( ) 함수로 그래프 세부 조정하기
- 3 geom_histogram( ) 함수로 연속형 데이터의 히스토그램 그리기
- UNIT 06 파이 차트: 상대적 크기 확인
- 1 파이 차트 데이터 준비하기
- 2 누적 막대 그래프 그리기
- 3 자동으로 파이 차트에 팔레트 색상 채우기
- 4 수동으로 파이 차트 색상 바꾸기
- UNIT 07 선 그래프: 추세 확인
- 1 선 그래프 데이터 준비하기
- 2 선 그래프 그리기
- 3 월별 매출 선 그래프 그리기
- 4 선 그래프 꾸미기
- UNIT 08 상자 그림: 데이터 분포 확인
- UNIT 09 ggplot2 그래프를 잘 활용하는 방법
- UNIT 10 정리
- 잠깐만요 기초 통계 이론과 통계적 가설 검정
- 1. 평균
- 2. 편차
- 3. 분산
- 4. 표준편차
- 5. 정규분포
- 6. 추론 통계와 가설 검정
- 7. t분포와 t검정
- 8. 기술 통계와 가설 검정
- 9장 더 맛있는 요리하기: 멤버십 기획 프로젝트
- UNIT 01 김아루 과장과 함께 멤버십 기획 프로젝트 시작
- UNIT 02 빈도 분석: 지점별 예약 건수와 매출은 어떻게 될까?
- 1 빈도표 만들기: table( ) 함수
- UNIT 03 교차 빈도 분석: 지점별 메뉴 아이템 주문 비율은?
- UNIT 04 RFM 분석: 우리 회사의 고객 현황은 어떨까?
- UNIT 05 상관 분석: 스테이크와 와인은 관계가 있을까?
- UNIT 06 의사 결정 나무: 어떤 고객이 스테이크를 주문할까?
- UNIT 07 분석 결론: 최종 멤버십 프로그램 결정