본문 바로가기

R

R - 조합, 집계

# 조합 함수 combn() : 조합 추출하기

# 5개 데이터 중에서 3개를 선택할 때 조합의 갯수 출력하기
cbn <- combn(1:5,3)
cbn
ncol(cbn)

# 집계 함수 aggregation() : 데이터 그룹에 대해, 합계, 평균 계산.

# iris 데이터 셋에서 각 품종별로 꽃잎, 꽃받침의 폭과 길이의 평균을 조회하기

agg <- aggregate(iris[,-5],by=list(iris$Species),FUN=mean)
agg

# iris 데이터 셋에서 각 품종별로 꽃잎, 꽃받침의 폭과 길이의 표준편차 조회하기

agg <- aggregate(iris[,-5],by=list(iris$Species),FUN=sd)
agg

# mtcars 데이터셋에서 cyl과 vs를 기준으로 다른 열들의 최댓값을 조회하기
agg <- aggregate(mtcars, by=list(cyl=mtcars$cyl,vs=mtcars$vs),FUN=max)
agg

# 낙태 금지(abortion)에 대한 성별(gender)별 찬성(Yes)/반대(No) 비율 조회하기
agg <- aggregate(CES11$abortion,by=list(성별=CES11$gender),FUN=table)
agg


ncol(agg)
agg2 <- agg[,2]  # ncol에서 agg는 2개 열인데 뒤에 열이 x로 묶인 no / yes 가 하나의 2번째 열이다
sum(agg2[1,]) #여성 인원수
sum(agg2[2,]) #남성 인원수
agg2[1,] <- agg2[1,]/sum(agg2[1,]) 
agg2[2,] <- agg2[2,]/sum(agg2[2,]) 
agg2
agg2[1,]
agg2[2,]
agg2


rownames(agg2) <- agg[,1]
agg2

 

'R' 카테고리의 다른 글

R - 방사형 차트(radar chart)  (0) 2021.06.01
R - treemap (나무지도)  (0) 2021.06.01
R - 샘플링(sampling)  (0) 2021.05.31
R - 정렬 (sort, order)  (0) 2021.05.31
R - 결측값 처리  (0) 2021.05.28