In Statistics We Trust
-
Moving Average Process
[작성중…] 앞서 Random Walk Prcoess에 대해서 알아보았는데 Random Walk Process는 1차 차분한 시계열 데이터가 정상 프로세스이면서 자기상관관계가 없는 시계열 데이터였다. 그러나 정상 시계열 중에서도 자기상관관계가 있는 경우가 있다. 이러한 시계열 데이터는 이동평균 MA(q) 모델, 자기회귀 AR(p) 모델, 자기회귀이동평균 ARMA(p,q) 모델을 활용하여 향후 시계열 데이터의 흐름을 예측한다. 이 모델들은 모두 과거...
-
Random Walk Process
시계열 데이터(time series) 예측은 일반적인 회귀분석을 활용한 예측과 다른 부분이 있어 별도 게시글을 작성하여 이에 관한 내용을 정리하고자 한다. 시계열 데이터를 활용한 예측과 회귀분석을 통한 예측 모두 과거의 데이터를 활용하여 앞으로의 데이터를 예측하고자하는 목표는 동일하나 다음의 포인트에서 크게 다르다고 볼 수 있다. 시계열 데이터는 예측 과정에서 데이터의 순서를 고려해야 한다....
-
Uplift Model
업리프트 모델링(Uplift Model)은 특정 마케팅의 무작위 대조실험(A/B테스트) 결과를 분석하여 마케팅을 어떠한 유형의 고객에게 보내야 효과가 있는지를 예측하는데 사용하는 모델이다. 일반적인 A/B테스트 실험은 실험군과 대조군의 반응 여부만 판단하지만, Uplift Model은 실험군과 대조군에서 “어떤 특징을 가지는 표본”이 반응/반응하지 않았는지도 확인한다. 반응자들의 표본이 가지는 특징을 파악한 후, 마케팅 효과가 있을법한 대상을 예측하여 이후...
-
Bayes Filter
Bayes Filter는 Kalman Filter, Particle Filter의 기본이 되는 개념으로 Bayes Rule을 따르는 재귀적인 필터이다. Bayes Filter는 prior와 likelihood를 통해서 posterior를 구하고 이 posterior가 다음 단계의 prior로 작용한다는 점에서 재귀적이라 표현한다. Bayes Filter에 사용되는 notation을 활용하여 표현하면 다음과 같다. 초기시간 1부터 시간 t까지 측정센서 값의 시퀀스를 \(\mathbf{z} =\{z_{1},z_{2},...,z_{t}\}\), 제어입력의 시퀀스를 \(\mathbf{u}...
-
Label Spreading
Label Spreading은 일부 데이터의 label이 존재하지 않는 데이터에서 semi-supervised learning 을 수행하는 모델 중 하나로 label이 주어진 일부 데이터셋의 정보만을 가지고 그래프 이론을 바탕으로 데이터에 label을 부여하는 작업을 수행한다. label이 존재하는 데이터로부터 label에 대한 정보가 label이 존재하지 않는 데이터로 퍼져가는 모델이라 볼 수 있다. Label Spreading 모델은 유유상종이라는 굉장히 직관적인...