회귀분석 예제 데이터

미니탭의 회귀는 도구 모음에서 몇 번의 클릭만으로 통계 메뉴를 통해 액세스됩니다. 이 엄지 손가락 규칙은 일반적으로 허용되지만 Green(1991)은 이 것을 한 단계 더 발전시키고 회귀에 대한 최소 샘플 크기는 50이어야 하며 기간당 8개의 관측값은 추가로 사용해야 한다고 제안합니다. 예를 들어 상호 작용하는 변수와 세 개의 예측 변수가 있는 경우 과적합을 방지하려면 샘플에 약 45-60개의 항목이 필요하거나 녹색에 따라 50 + 3(8) = 74개의 항목이 필요합니다. 제곱다중 상관계에 대한 정확한 값을 찾고, 제곱다중 상관계의 수축을 최소화하거나, 또 다른 특정 목표를 가지고 있다면, 그레고리 Knofczynski의 논문은 가치 있는 읽기및 제공됩니다. 추가 연구를 위한 많은 참고 자료와 함께. 즉, 많은 사람들이 단지 추세의 일반적인 아이디어를 얻기 위해 MLS를 실행하고 싶어하고 그들은 매우 구체적인 견적을 필요로하지 않습니다. 이 경우 엄지 손가락 규칙을 사용할 수 있습니다. 문헌에는 샘플에 100개 이상의 항목이 있어야 한다는 것이 널리 명시되어 있습니다. 이것은 때때로 적절하지만, 적어도 200 개의 관측또는 더 나은 관찰이 있는 경우 400 개 이상의 더 안전한 편에 있을 것입니다. 3단계: 왼쪽 창에서 종속 값에 대한 변수 이름을 클릭합니다. 이 샘플 질문의 경우 소비된 칼로리가 체중에 영향을 미치는지 알고 있으므로 칼로리는 독립 변수(Y)이고 무게는 종속 변수(X)입니다. « 칼로리 »를 클릭한 다음 « 선택 »을 클릭합니다. 예문: 하루에 소비되는 칼로리를 체중과 비교하는 다음 데이터 포인트 집합에 대한 Minitab에서 회귀 찾기: 일일 소비 칼로리(140), 2810(143), 2805(144), 2705(145), 3000(130), 2400(130), 240(10), 240(101), 240(1010), 24010(1010) 2000 (99), 2350 (120), 2400 (121), 3000 (155).

원시 데이터 파일은 모두 텍스트(ASCII) 형식으로 되어 있으므로 다른 소프트웨어 패키지와 다른 작업 프로세서에서 읽을 수 있습니다. 변수 이름은 첫 번째 행에 있고 열은 공백으로 구분됩니다. 자동화된 단계별 회귀는 작은 데이터 집합에 대한 과적합 솔루션으로 사용해서는 안 됩니다. Babyak (2004)에 따르면 회귀 방정식을 사용할 때마다 방정식이 데이터에 얼마나 잘 맞는지 물어봐야합니다. 적합성을 평가하는 한 가지 방법은 다음 수식에서 계산할 수 있는 결정 계수를 확인하는 것입니다. « 표본 크기 질문에 대한 대답은 연구원의 목표, 해결중인 연구 질문 및 활용되는 모델 유형에 부분적으로 의존하는 것으로 보입니다. 여러 회귀를위한 최소 샘플 크기에 대한 권장 사항을 제공하는 여러 연구 기사와 교과서가 있지만, 몇 가지는 충분히 큰 많은 MLR의 예측 측면을 해결하지 에 동의합니다. » ~ 그레고리 T. Knofczynski 회귀도 이 그래프의 경우 0.702인 R 제곱 값을 제공합니다. 이 숫자는 모델이 얼마나 좋은지 알려줍니다.