Juhans
article thumbnail
[시계열 분해 (Time Series Decomposition)]
ML & DL/시계열 2022. 10. 22. 12:27

시계열 분해 시계열 데이터는 여러가지 성분으로 나눠서 생각해볼 수 있다. 대표적으로 시계열 데이터에는 계절성분 S, 추세-주기 성분 T, 그 외의 나머지 성분 R이 있다. 그러므로 시계열 데이터를 분해한다면 S, T, R의 조합으로 분해할 수 있게 된다. 분해 방법 시계열 데이터는 S, T, R로 분해될 때 두 가지 방법으로 분해될 수 있다. 바로 덧셈 분해(Additive Decomposition)과 곱셈 분해(Multiplicative Decomposition)이다. 덧셈 분해(Additive Decomposition) 덧셈 분해는 위 수식과 같이 덧셈으로 시계열 데이터를 설명한 것이다. 덧셈 분해는 계절성 요동의 크기(S의 요동)나 추세-주기 주위의 변동(T의 변동)이 시계열 수준에서 변하지 않을 ..

article thumbnail
Shapley Values (shap)
ML & DL/XAI 2022. 9. 12. 17:10

Shapley Values (shap) Shapley values는 모델이 예측한 값이 평균과 비교했을 때 어떤 변수들이 감소 또는 증가하도록 기여했는지(회귀, 0 ~ 1 사이의 확률에서 감소 또는 증가하도록 기여했다면 분류) 계산하는 방법이다. 기여도 계산 기여도를 계산하는 방법은 기여도 계산을 원하는 변수를 제외한 모든 feature들의 포함여부에 따라 모든 경우의 수를 뽑고 각각의 경우의 수에 대해서 기여도 계산을 원하는 변수가 포함되었을 때와 포함되지 않았을 때의 예측값의 차이를 계산한다. 이후 이 예측값들의 평균을 구한 것이 해당 변수가 모델이 예측한 값에 대한 기여도가 된다. 예를 들어, 아래와 같은 집값 계산 모델과 데이터가 있다고 가정해보자. 위와 같은 데이터에서 반려동물 허용 변수에 대해..