machine learning

시계열 비지도학습의 유의점 & 해석방법

임이레 2023. 5. 11. 19:20

군집화(*클러스터링) Algorithm 

  •  k means Clustering 
    - 파라미터 : k
  • Agglomerative Clustering(병합군집)
    - 파라미터 : eps 

일반적인 벡터의 유사도 측정 

  • 유클리드 거리(Euclidean distance 또는 L2 distance) 
    - 장점 : 계산이 용이하고 연산속도가 빠르다. 
    - 단점
    1. 동일한 시간 구간끼리 비교하게 되면, 신호의 떨림과 움직임이 심해질수록 어긋나게 된다.
    2. 길이가 다른 시계열 분석 불가.

DTW(동적 시간 워핑)을 이용한 시계열 유사도 측정 

  • 장점 
    1. 서로 다른 길이의 시계도 유사도 분석 가능
    2. 다차원 시계열 데이터의 분석 가능
  • 단점 
    1. 연산비용이 크다.