통계statistics - 모형의 보정ㆍ검증 방법에 대해 설명하자.
5. 모형의 보정ㆍ검증 방법에 대해 설명하라.
5.1 모형에 관련된 용어
5.1.1 모형
화학적, 물리적, 생물학적 과정의 양에 관한 공식은 계를 모형화 한다.
5.1.2 상태 변수
종속 변수는 모형화 되어질 것이다(전후 관계상, 보통 화학 물질의 농도).
5.1.3 모형 매개변수
모형의 계수는 물질평형식(예: 속도상수, 평형상수, 화학양론적 비율)공식화 하기 위해서 사용된다.
5.1.4 모형 입력
모형을 실행하기 위해서 요구되는 촉진 기능이나 상수.(예: 유량, 유입되는 화학물질의 농도, 온도, 일광).
5.1.5 보정
모형의 결과와 현장 측정사이의 비교를 통해 통계적으로 수용가능성 평가; 모형의 자료를 수정이나 조정하여 문헌상에서 발표된 실험 결정값들 범위안에 들도록 하여야 한다.
5.1.5 보정
모형의 결과와 현장 측정사이의 비교를 통해 통계적으로 수용가능성 평가; 모형의 자료를 수정이나 조정하여 문헌상에서 발표된 실험 결정값들 범위안에 들도록 하여야 한다.
5.1.6 검증
모형의 결과와 서로 다른 연도에 대한 현장측정이나 서로다른 지형에 대한 측정사이의 비교를 통해 통계적으로 수용가능성 평가; 모형 매개변수는 고정되어 있으면 수정할 수가 없다 다면 보정 과정이 끝난 후에는 가능하다.
5.1.7 시뮬레이션
어떠한 입력자료(비록 가상의 입력이라 할지라도)의 구성으로도 모형사용이 가능하며 현장자료에 대한 보정이나 검증 필요하지 않다.
5.1.8 확인(Validation)
정확한 수용
(1) 모형은 모든 중요하고 특징적인 과정을 포함해야 한다.
(2) 과정들이 정확하게 공식화되어야 한다.
(3) 모형은 사용자가 의도한 목적에 맞도록 적당하게 관찰된 현상들을 설명해야 한다.
5.1.9 Post 심사
시간에 따른 현장측정과 미래의 모형예측에 대한 비교.
5.1.10감도 분석
수적이 시뮬레이션이나 수학적인 기술을 통해서 결과상의 모형 매개변수들에 있어서 잔돈의 효과를 판단.
5.1.11 불안정성 분석
모형의 매개변수, 입력자료, 혹은 확률론적인 기술을 통한 초기상태등의 불확실성(표준편차)때문에 예상되어지는 값(평균)들의 불안정성에 대한 판단.
5.2 모형의 통계적 검증 방법
5.2.1 통계적 검증방법
수많은 관찰의 결과로써 얻어지는 숫자이며 일정한 때와 일정한 때와 장소에서 발생하는 일정한 집단적 현상을 그 현상의 부분 하나하나에 대해 대량으로 관찰, 계량하여 그 결과를 수치로 나타내는 일을 뜻한다.
5.2.2 통계적 분석방법
5.2.2.1 Chi-square(카이자승법)
분포를 기초로 한 검정법(chi- square test,(카이자승법))은 여러 가지 응용법을 가진 통계법이며, 특히 빈도 비교법이라고 불리울 만큼 자료가 빈도로 주어졌을 때 가장 많이 쓰이는 통계법이다.
5.2.2.2 Kolmogorov-Smirnovtest(스미느로프 검증)
두 모집단이 서로 동일한 부호를 가지는 지를 알아보기 위한 검증이다.
5.2.2.3 T-test
두 집단간의 평균의 차이가 통계적으로 유의한지를 파악할 때 필요한 통계적 기법이다. 일반적으로 두 집단의 평균을 비교하는 분석방법은 Z-test와 T-test로 나뉘는데 Z-test는 모집단의 분산을 알고 있는 경우에만 사용된다. 그러나 모집단의 분산을 알고 있는 경우는 거의 없기 때문에 T-test를 사용하게 된다.
(1) 독립표본과 대응표본 T-test
-독립표본 T-test
두 집단간의 차이를 알아보기 위해 사용하는 방법이다.
-대응표본 T-test
동일한 집단에 있어 처치 전후의 차이를 알아보기 위해 주로 사용한다.
5.2.2.4 분산분석(Analysis of variance, ANOVA)
통계학에서 두 개 이상 다수의 집단을 비교하고자 할때 집단내의 분산, 총 평균과 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F분포를 이용하여 가설검정을 하는 방법이다. 종류에는 일원변량분석, 이원변량분석, 다변량분석, 공변량분석 등이 있다.
(1) 일원변량분석(one-way ANOVA)
독립변인은 1개이며, 독립변인의 집단이 2개 이상인 경우이다.
예) 학력에 따른 의복구매 정도의 차이
학력-독립변인, 학력의 집단-중졸, 고졸, 대졸 등으로 2개 이상
변량분석의 경우 독립변인의 집단이 2개 이상이므로 사후분석을 실시한다.
(2) 이원변량분석(two-way ANOVA)
독립변인의 수가 두 개 이상일 때 집단간 차이가 유의한지 검증하는 데 사용한다. 독립변인 2개, 종속변인이 동일
예) 학력, 성별에 따른 의복관심도의 차이
학력, 성별-독립변인, 종속변인-의복관심도
이원변량분석은 주효과와 상호작용효과를 볼 수 있다.
주효과-성별(a), 학력(b) 상호작용효과-a*b
(3) 다변량분석(MANOVA)
단순 ANOVA를 연장해서 두개 이상의 종속변인이 관계된 상황에 적용시킨 것으로서 둘 이상의 집단 간 차이를 검증 할 수 있다.
(4)공변량분석(ANCOVA)
다원변량분석에서 특정한 독립변인에만 초점을 두고 다른 독립변인은 통제변수로 하여 분석하는 방법이다. 즉, 특정한 사항을 제한을 한 후 ANOVA분석을 한다.
(5)F분포
분산의 비교를 통해 얻어진 분포비율이다. 이 비율을 이용하여 각 집단의 모집단분산이 차이가 있는지에 대한 검정과 모집단평균이 차이가 있는지 검정하는 방법으로 사용한다. 즉 F = (군간변동)/(군내변동)이다. 만약 군내변동이 크다면 집단간 평균차이를 확인하는 것이 어렵다. 분산분석(ANOVA)에서는 집단간의 분산의 동질성을 가정하고 하기 때문에 만약 분산의 차이가 크다면 그 차이를 유발한 변인을 찾아 제거해야 한다. 그렇지 못하면 분산분석의 신뢰도는 나빠지게 된다.
5.2.2.5 요인분석(factor analysis)
여러 변인간의 관계성이나 패턴을 파악하고 변인들이 갖고 있는 정보를 잠재된 적은 수의 구조(construct)로 축약하거나 요약하기 위해 사용하는 통계기법이다. 따라서 요인분석을 통해 수많은 변인들의 상호 관련성을 분석할 수 있고, 이러한 관련성을 기초로 각 변인들이 공통으로 측정하고 있는 차원(잠재적인 요인)을 파악하고 설명할 수 있다. 또한 요인분석은 과학이 추구하는 절약성의 원리(principle of parsimony)를 가장 충실히 따르는 분석방법 가운데 하나이다. 요인분석을 통해 추출된 요인(차원)은 무수히 많은 관찰변인들의 특성을 가장 잘 대표하는 개념이기 때문에 현상을 단순하고 명료하게 설명하는 효율성을 갖는다.
5.3 모형의 보정 및 검증
모형의 보정과 검증을 수용하기 위한 통계학적인 기준은 시뮬레이션을 수행하기 전에 우선적으로 구축되어야 한다. 모형의 결과가 얼마나 신뢰할 만한가는 모형이나 예측의 올바른 사용에 의존한다. 또한 모형의 보정과 검증의 수용기준은 모형을 사용한 목적에 의존하기도 한다.
모형의 보정과 검증의 수용은 모형 자체가 법적으로 확인이 된 상태라면 반드시 수행하여할 필요는 없다. 모형이 하나의 설정된 환경에서 잘 실행되는 것은 가능하지만 또 다른 환경에서는 미약한 부분이 있을 수 있다. 모형은 다양한 지역에 대해서 다른 상태로 적용된다. 따라서 모형의 확고함과 모형의 신뢰성을 갖추어야 한다. 정확하게 모형의 심도 있는 확인이 이루어 진 경우와 불안정한 상태가 안정화되었을 경우는 비슷한 문제이다.
이것은 단계적인 과정이다. 모형을 사용하였을 경우에는 다른 어떠한 방법들보다도 융통성이 있으며, 더 나아가서는 모형의 타당성과 공식 등을 시험해 볼 수 있다. 모형 결과에 대한 Post 심사는 모형의 효용성을 검사해 보기 위해서 중요하다. 이 심사는 모형 예측이 수행된 후에 이루어지며 미래의 자료로 활용할 수 있도록 만들어 준다. 문헌의 경우를 살펴보면 post 심사에 대한 부분은 아주 미약하다. 따라서 더욱더 많은 연구가 필요하다.
'PPT' 카테고리의 다른 글
전통음식 - 김치 (0) | 2020.01.19 |
---|---|
New Zealand 뉴질랜드 국가 조사 (0) | 2020.01.09 |
정보 보안 - 암호 (0) | 2019.12.27 |
5 Nuts to Eat in the Winter for Women (0) | 2019.12.27 |
5 maneras de mantener la presión arterial normal (0) | 2019.11.30 |