본문 바로가기

R

R - 산점도(scatter plot)

산점도 : 다중변수 데이터에서 두 변수에 포함된 값들을 2차원 그래프상에 점으로 표현하여 분포를 관찰할 수 있도록 하는 도구 

 

# mtcars의 wt 데이터와 mpg 데이터 사이의 관계를 확인하기 위해 산점도 그래프 그리기 

plot(mtcars$wt,mtcars$mpg,main='중량-연비 그래프',xlab='중량(wt)',ylab='연비(mpg)',col='red',pch=19)

* 대략적으로 우하향하는 산점도 관계를 확인할 수 있다. 즉, 음의 상관관계가 있다고 볼 수 있다. 

-> 중량이 높을 수록 연비가 낮아진다.

* pch : 점의 종류이다.  아래 숫자를 입력할시 해당하는 모양으로 출력된다. 

# 여러 변수들 간의 산점도

vars <- c('mpg','disp','drat','wt')
target <- mtcars[,vars]
plot(target,main='여러변수들간의 산점도')

* 각각의 변수별로 상관관계를 대략적으로 파악할 수 있다. 우상향(양의 상관), 우하향(음의 상관) 또는 상관 관계가 없음을 알 수 있다. 

 

# 그룹 정보가 있는 2개 변수의 산점도 
iris2 <- iris[,3:4]
levels(iris$Species)
group <- as.numeric(iris$Species)
color <- c('red','green','blue')
plot(iris2,main='iris 산점도',pch=c(group),col=color[group])

# 범례 설정하기

1)우측하단
legend(x='bottomright',legend=levels(iris$Species),
       col=color,pch=c(1:3))

2)상단

legend(x='top',legend=levels(iris$Species),
       col=color,pch=c(1:3))

3)좌측상단

legend(x='topleft',legend=levels(iris$Species),
       col=color,pch=c(1:3))

# Quiz 정서적 지원제도(emotional) 만족도 물질적 지원제도(tangiblesat), 연령대(age) 에 대해 산점도를 작성하되 성별에 따라 점의 모양과 색을 다르게 처리하기

head(socsupport)
group <- as.numeric(socsupport$gender)
group
data <- socsupport[,c('emotional','tangiblesat','age')]
data
color <- c('red','blue') #여 red 남 blue
plot(data,pch=group,col=color)

 

'R' 카테고리의 다른 글

R - 샘플링(sampling)  (0) 2021.05.31
R - 정렬 (sort, order)  (0) 2021.05.31
R - 결측값 처리  (0) 2021.05.28
R - attach/detach 함수  (0) 2021.05.28
R - 상자그림(box plot)  (0) 2021.05.27