회귀분석(Regression)
회귀분석 : 주어진 (독립)변수로 (종속)변수를 예측하기 위한 분석이다. - 단순 회귀(Simple Regression) : 독립변수 1개 & 종속변수 1개 - 다중 회귀(Multiple Regression) : 독립변수 2개 이상 & 종속변수 1개 ex) 수입과 지출의 관계 ID 수입 지출 1 1,534,000 1,200,500 2 1,323,500 1,040,330 3 3,543,200 2,350,350 ... ... ... 53 7,753,000 6,540,270 예를 들어, 위와 같은 데이터와 그래프가 존재할 때 주어진 수입의 최대값이 7,753,000원 일때 그보다 많은 수입이 발생할때 대략 얼마의 지출을 하게되는지 예측하려면 추세선이 필요하다. 추세선 : y^ = a +bx 점들 : y = a..
상관관계(공분산, 상관계수)
1. 상관관계란? 기온을 x로 판매량을 y로 순서쌍으로 표시 ex) (14.2, 215) 좌측의 표를 이용하여, 우측의 산점도로 그린다. 즉, 순서쌍을 그래프 위 점으로 표현한다. 이럴 경우, 점들이 일정한 패턴을 나타낼 수 있는데, 위의 예시에서는, 기온이 오를수록 아이스크림의 판매량도 오른다고 볼 수 있다. 반대로, 기온이 떨어질수록 아이스크림의 판매량은 떨어진다. 즉, 두가지의 변량 사이의 일정한 관계가 성립한다고 볼 수 있다. => 상관관계 : 두 가지의 변량 사이의 관계 양의 상관관계 : x값이 커지면 y의 값도 커진다. 음의 상관과계 : x값이 작아지면 y의 값도 작아진다. 기울기 > 0, y의 증가량 / x의 증가량 2. 공분산이란? X나 Y의 분산은 X나 Y의 값이 얼마나 퍼져있는지를 표현..