더북(TheBook)

1.2 R의 필요성

R은 다양한 통계 소프트웨어 가운데 다음 관점에서 ‘좀 더 앞선다’는 평가를 받고 있다.

무료: R은 무료다. 라이선스를 따로 구입할 필요가 없고, R을 비롯한 대부분의 확장 패키지를 사용할 수 있는 재정적인 진입 장벽 또한 전혀 없다.

오픈 소스: R과 대부분의 패키지는 완전히 오픈 소스다. 개발자 수천 명이 패키지의 소스 코드를 지속적으로 검토하며, 해결해야 하는 버그가 있는지 아니면 개선할 점은 없는지 확인한다. 문제가 발생하면 직접 소스 코드를 파헤치고, 문제가 있는 곳을 찾아 해결하는 데 기여할 수도 있다.

인기: R은 데이터 마이닝, 데이터 분석과 시각화를 수행하는 데 가장 널리 사용하는 통계 프로그래밍 언어이자 플랫폼이다. 인기가 많다는 것은 그만큼 같은 언어를 ‘사용하는’ 사람이 많다는 것을 의미한다. 또 이는 다른 사용자와 의사소통도 더 쉽다는 의미다.

유연성: R은 동적 스크립트 언어다. 함수형 프로그래밍이나 객체 지향 프로그래밍 같은 여러 패러다임의 프로그래밍 스타일을 허용할 만큼 유연성이 매우 뛰어나다. 또 유연한 메타 프로그래밍을 지원한다. 이러한 유연성으로 고도로 커스터마이즈되면서 동시에 종합적인 데이터 변환과 시각화를 수행할 수 있다.

재현성: 그래픽 사용자 인터페이스 기반의 소프트웨어를 사용하려면 원하는 메뉴를 선택하고 해당하는 버튼을 클릭한다. 하지만 스크립트를 작성하지 않고 자동으로 수행한 작업을 정확하게 그대로 재현하기는 쉽지 않다.

대부분의 과학 연구 분야와 산업 응용 분야에서는 여러 가지 이유에서 재현성이 필요하다. R 스크립트를 사용하면 사용자가 컴퓨팅 환경과 데이터로 수행하는 작업을 정확하게 설명하기가 용이하며, 모든 작업을 처음부터 완전히 재현할 수도 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.