목록Statistics Basic (3)
Gaegul's devlog
1. 정상성 (Stationary) 시계열 데이터의 특성이 시간의 흐름에 따라 변하지 않는다는 것을 의미. 정상 시계열은 장기적으로 예측 가능한 패턴을 갖지 않으며, 시계열 그래프는 일정한 변동폭(일정한 분산)을 가지며, 대체로 수평에 가까운 패턴(일정한 평균)을 보인다. 즉, 데이터가 정상성을 보인다는 것은 평균과 분산이 안정화 되어 있어 분석하기 쉽다는 것을 의미. 1) 비정상성(non-stationary) : 추세나 계절요인은 시간이 경과하면서 관측값에 영향을 미치기 때문에 추세 성분이나 계절 성분을 갖는 시계열 2) 정상성(stationary) : 불규칙 성분만으로 구성된 시계열은 정상적. 어느 시점에서 관찰하든 관측값은 불규칙한 변동을 제외하면 동일한 모습을 가짐. 추세나 계절 요인이 포함되어 ..
1. 시계열 분석이란? 시계열 분석(time series analysis)는 시간의 흐름에 따라 일정한 간격으로 사건을 관찰하여 기록한 데이터를 바탕으로 미래의 관측값을 예측하는 분석 기법. 과거의 일련의 관측값을 분석하여 모델링하고, 이 예측모델을 바탕으로 미래의 관측값을 예측 시계열 데이터는 일반적으로 추세 성분(trend), 순환(cycle), 계절(seasonal) 성분, 불규칙(irregular) or 우연(random) 성분 등으로 구성되며, 이 성분들에 의해 변동된다고 가정. 시계열 데이터는 일반적으로 관측값의 전반적 상승 또는 하락 경향을 나타내는 추세 성분과 설명 안되는 오차(error)를 나타내는 불규칙 성분으로 구성. 1) 추세(Trend) 변동 시간이 경과함에 따라 관측값이 지속적으..
1. 확률변수와 확률분포 표본공간 : 통계적 실험이나 조사에서 모든 가능한 실현 결과들의 집합. 확률변수 : 표본공간 S 에서 정의된 실수값 함수 X 확률분포 : 확률변수 X와 확률을 대응시켜주는 관계 e.g. 동전을 3번 던지는 실험 S = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT} => 2의 3승 경우의 수 X = 앞면이 나올 수 있는 수 X = 0(아예 안나올 경우), 1, 2, 3(3번 다 나올 경우) P(X = 0) : 1/8 P(X = 1) : 3/8 P(X = 2) : 3/8 P(X = 3) : 1/8 1.1 이산 확률 변수 - 확률 질량 함수 이산 확률 변수 : 확룰변수 X가 취할 수 있는 값이 이산적인 값. e.g. 동전을 두번 던져서 나오는 앞면의 수, 주..