더북(TheBook)

1.5 간단한 예

이 절에서는 콘솔 창에서 명령을 입력하여 연산을 수행하고, 모델 피팅과 그래프를 생성하는 간단한 예제를 실습한다.

먼저 정상 분포에서 추출한 난수 100개로 된 x 벡터를 생성하자. 그런 다음 숫자 100개로 구성된 또 다른 y 벡터를 만든다. 각 원소는 x3배한 값에 2를 더하고 임의의 노이즈가 섞인 값을 갖는다. <-는 대입 연산자로, 나중에 자세히 다룰 것이다. str()을 사용하여 벡터 구조를 출력한다.

> x <- rnorm(100)
> y <- 2 + 3 * x+ rnorm(100) * 0.5
> str(x)
num [1:100] -0.4458 -1.2059 0.0411 0.6394 -0.7866 ...
> str(y)
num [1:100] -0.022 -1.536 2.067 4.348 -0.295 ...

이미 x와 y 사이에 y = 3x + 2 + e라는 관계가 있다는 사실을 알고 있으므로 두 샘플 x와 y 사이에 간단한 선형 회귀 모델을 적용할 수 있다. 이때 선형 모델의 파라미터(2와 3)는 어떻게 찾는지 알아보자. 이를 위해 lm(y ~ x) 함수를 사용할 것이다.

> model1 <- lm(y ~ x)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.