III. 통계 데이터 시각화: ggplot2
SVH Neurology Code, Stats & AI (with R)
서문
I. R 언어의 기초
1
R과 RStudio 설치
2
값, 이름, 할당, 연산
3
벡터(
vector
)의 기초
4
데이터프레임(
data.frame
)의 기초
5
R 팩터(
factor
)
6
조건, 반복, 함수
7
R package
기초
8
R 파이프 연산자(
pipe
)
II. Tidyverse와 Tidy Data
9
Tidy Data
의 개념과 데이터 수집
10
tidyr
패키지로 데이터 정리
11
dplyr
로 데이터 가공
12
dplyr
연습
13
tidyselect
열 선택
14
관계형 데이터베이스 기초 개념,
Joins와 two-table verbs
15
윈도우 함수(
window functions
)
16
R 문자열과
stringr
패키지
17
R 정규 표현식(
Regular Expression
)
18
lubridate
패키지로 날짜와 시간 처리
19
귀찮은 것을 해결해 주는
janitor
패키지 (정리중)
III. 통계 데이터 시각화: ggplot2
20
ggplot2
통계 그래픽의 기초
21
스케일(
scales
)과
Color Scale
22
ggplot2
레이어(
layers
)와 통계적 변환(
stats
)
23
팩터의 레벨에 따른 순서 조정(
forcats
패키지를 중심으로)
24
그래프 테마(
theme
) 커스터마이징
25
주요 통계 그래프 모음 (작성중)
IV. R 통계 분석
26
R로 통계를 하려면 꼭 알아야 하는 R 포뮬러(
Formula
)
27
통계 분석 결과의 활용도를 높여주는
broom
패키지
28
P-value
의 의미 (with
infer
package)
29
두 연속 변수의 평균 비교:
t-test
30
두 연속 변수의 상관관계:
correlation
31
분산 분석의 기초: 제곱합(
sum of squares
)을 중심으로
32
분산 분석(
ANOVA
)
33
명목 변수 분석의 시작: 분할표(
contingency table
)
34
분할표 분석: 두 명목 변수의 독립성을 검정-
카이제곱(Chi-Squared)
검정
35
infer 패키지로 가설 검정하기
참고문헌
III. 통계 데이터 시각화: ggplot2
19
귀찮은 것을 해결해 주는
janitor
패키지 (정리중)
20
ggplot2
통계 그래픽의 기초