데이터 분석을 위한 프로그래밍 언어로 PythonR이 주로 사용되는데, Python은 데이터 분석을 위해서 만들어진 언어는 아니다. 소프트웨어를 개발하기 위한 일반 프로그래밍 언어지만, 딥러닝을 활용할 수 있는 라이브러리가 있는 등의 기능을 많이 포함하고 있기 때문에 데이터 분석 분야에서 주목을 받고 있다.

반면, R은 데이터 분석을 위한 용도로 만들어진 언어다. 다른 프로그래밍 언어에 비해 문법이 간단하기 때문에 프로그래밍 지식이 많지 않아도 되기에 쉽게 사용할 수 있는 것이 장점이다.

 

1. R Installation

 

The Comprehensive R Archive Network

 

cran.r-project.org

 

 

RStudio | Open source & professional software for data science teams

RStudio provides free and open source tools for R and enterprise-ready professional software for data science teams to develop and share their work at scale.

rstudio.com

개발환경(OS)에 맞는 R과 R Studio를 순서대로 설치한다. 설치할 때, 관리자 권한으로 실행하지 않거나 Windows 계정 이름이 한글로 되어있으면 오류가 발생할 수 있으니 주의해야 한다.

 

2. R Studio

R Studio는 Source, Console, Environment, Files 창으로 나뉜다.

1) Source : 명령어를 입력하는 편집기 창이다. 입력한 명령을 실행하기 위해서는 실행할 행을 클릭해서 Ctrl + Enter를 누른다. 여러 줄을 동시에 실행하려면 실행할 행만큼 드래그해서 영역을 표시한 후 Ctrl + Enter를 누른다.

2) Console : 명령어를 입력 후 Enter를 누르면 바로 결과가 출력된다.

3) Environment : Console에서 명령어를 실행했을 때 생성된 데이터가 보이는 창이다. 이 외에, 명령어를 실행한 기록을 보여주는 History, SQL이나 Spark 등의 DB와 연결하는 Connections 등이 있다.

4) Files : 폴더에 있는 파일을 보여주는 창이다. 이 외에 명령어를 실행했을 때 나타나는 그래프를 보여주는 Plots, 설치된 패키지 목록을 보여주는 Packages 등이 있다.

 

3. Variable

R에서 변수를 만들 때는 =을 사용하지 않고, <- 를 사용한다.

실행한 예시와 같이, sum()함수를 사용해서 두 수의 합을 더한 결과는 제대로 출력된다. 그러나 a와 b의 값을 확인했을 때 =을 사용해서 만든 b는 찾을 수 없기 때문에 변수를 만들 때는  <- 를 사용하는 것을 권장한다. <-를 입력하는 것은 alt + -를 누르는 것과 같다.

c() 함수와 seq() 함수를 사용해서 한 변수에 여러 개의 값을 넣을 수도 있다. var2by는 두 수 사이의 간격을 의미한다. var3처럼 한 변수에는 수와 문자를 섞을 수도 있으며, 변수는 문자로 인식한다. var4처럼 seq() 함수는 숫자와 문자를 섞을 수 없으며, 숫자에 한해서만 사용할 수 있다.

mode()함수를 사용하여 변수형을 확인할 수 있다.

 

4. Operator

R에서 사용하는 논리 연산, 산술 연산자는 다음과 같다.

1) 비교/논리 연산자

< <= > >= == != | &
작다 작거나
같다
크다 크거나
같다
같다 같지 않다 또는 그리고

2) 산술 연산자

+ - * / %/% %% ^ 이나 **
더하기 빼기 곱하기 나누기 나머지 제곱

논리 연산자와 몫과 나머지를 구하는 산술 연산자를 제외한 연산자는 다른 프로그래밍 언어와 동일하게 사용할 수 있다.

728x90
반응형

'Programming Language > R' 카테고리의 다른 글

[R] 회귀분석 - 변수선택  (0) 2021.02.16
[R] 가설검정, 상관분석  (0) 2021.02.15
[R] ggplot2  (0) 2021.01.29
[R] Data Frame 2 - 결합, 결측치  (0) 2021.01.22
[R] Data Frame 1  (0) 2021.01.15
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 라이프코리아트위터 공유하기
  • shared
  • 카카오스토리 공유하기