통계 문제 예제
• 학생 A – J 각각의 중간고사 및 기말고사 성적을 다음과 같이 산포도로 나타냈다.
1번 풀이
• 중간고사와 기말고사 점수가 같은 학생 세 명은 누구인가?
- 산포도에 의하면 A, B, F 이 세 학생이 중간고사와 기말고사 점수가 같다. ∴ A, B, F
(2) 중간고사보다 기말고사 점수가 더 높은 학생 세 명은 누구인가?
- 산포도에 의하면 C, G, H 이 세 학생이 중간고사보다 기말고사 점수가 더 높다. ∴ C, G, H
(3) 기말고사의 평균성적은 25, 50, 75점 중 어디 근처에 있는가?
- 산포도에 의하면 50점 근처에 주로 몰려있으므로 기말고사의 평균 성적은 50점 근처에 있다. ∴ 50점
(4) 기말고사 성적의 표준편차는 10, 25, 50 중 어디 근처에 있는가?
위의 정규분포표를 이용해서 기말고사 점수를 X축에 두고 대략적으로 평균을 50이라고 둔다. 1SD를 구하려면 대략 전체에서 68%가 들어있어야 한다. 그런데 전체의 68%가 들어가기엔 10은 너무 적고 50은 대략 100%가 된다. 그래서 25이면 대략 68%가 되므로 기말고사 성적의 표준편차는 25 근처에 있다.
∴ 25
(5) 중간고사에서 50점 이상 받은 학생들의 기말고사 평균 성적은 30, 50, 70 중 어디 근처에 있는가?
- 산포도에서 중간고사에서 50점 이상 받은 학생은 B, D, E, I, J 이다. 이들의 기말고사 성적은 30점 근처에 몰려있으므로 평균 성적은 30점 근처에 있다. ∴ 30
(6) 참, 거짓을 판별하라.
‘대체로 중간고사 성적이 좋은 학생은 기말고사에서도 좋은 성적을 받았다.’
- 거짓이다. 중간고사 성적이 좋았던 E, I, J의 경우를 보면 기말고사에선 좋은 성적을 받지 못했다. ∴ 거짓
(7) 참, 거짓을 판별하라.
‘ 중간고사 성적과 기말고사 성적 사이에는 강한 양의 상관관계가 존재한다.’
- 거짓이다. 두 변수간에 양의 상관관계가 존재하면 한 변수가 증가할 때 다른 변수도 증가하는 경향이 있어야 한다. 하지만 산포도에선 그런 경향이 보이지 않는다.
∴ 거짓
2. 참, 거짓을 판별하고 설명하라.
‘ 상관계수가 0.90일 때 산포도상에서 90%의 점들이 하나의 직선상에 위치한다.’
2번 풀이
거짓이다. 상관계수는 하나의 직선 주위에 점들이 전체적으로 밀집해 있는 정도를 측정해 준다. 상관계수가 0.90이라는 것이 모든 점의 90%가 하나의 선 주위에 빽빽하게 밀집해 있다는 것을 의미하지는 않는다.
3. 두 변수 (X,Y)에 대한 자료가
(-1,1), (0,0), (1,1)로 주어져 있다고 하자.
X와 Y간의 상관계수는 얼마인가?
X를 제곱하여 이를 새로운 변수 W라고 하자.
W와 Y간의 상관계수는 얼마인가?
3번 풀이 (1)
(X,Y) → (-1,1), (0,0), (1,1)
이때, 상관관계를 구하는 공식은
n=3 일 때 - X의 평균 : -1 + 1 + 0 = 0 ÷ 3 = 0
- Y의 평균 : 1 + 0 + 1 = 2 ÷ 3 =
∴
∴ X와 Y간의 상관계수는 ‘0’ 이다.
3번 풀이 (2)
(W,Y) → (1,1), (0,0), (1,1)
n=3 일 때 - W의 평균 : 1 + 0 + 1 = 2 ÷ 3 =
- Y의 평균 : 1 + 0 + 1 = 2 ÷ 3 =
4. 10문제로 이루어진 어느 시험에서 부분점수는 없다. 강의 조교가 모든 학생에 대해 맞은 개수와 틀린 개수를 측정하였다. 두 개수간 상관계수는 얼마일지 답하고 설명하라.
0 -0.50 +0.50 -1 +1 알 수 없다.