machine learning
시계열 비지도학습의 유의점 & 해석방법
임이레
2023. 5. 11. 19:20
군집화(*클러스터링) Algorithm
- k means Clustering
- 파라미터 : k - Agglomerative Clustering(병합군집)
- 파라미터 : eps
일반적인 벡터의 유사도 측정
- 유클리드 거리(Euclidean distance 또는 L2 distance)
- 장점 : 계산이 용이하고 연산속도가 빠르다.
- 단점
1. 동일한 시간 구간끼리 비교하게 되면, 신호의 떨림과 움직임이 심해질수록 어긋나게 된다.
2. 길이가 다른 시계열 분석 불가.
DTW(동적 시간 워핑)을 이용한 시계열 유사도 측정
- 장점
1. 서로 다른 길이의 시계도 유사도 분석 가능
2. 다차원 시계열 데이터의 분석 가능 - 단점
1. 연산비용이 크다.