군집화(*클러스터링) Algorithm
- k means Clustering
- 파라미터 : k - Agglomerative Clustering(병합군집)
- 파라미터 : eps
일반적인 벡터의 유사도 측정
- 유클리드 거리(Euclidean distance 또는 L2 distance)
- 장점 : 계산이 용이하고 연산속도가 빠르다.
- 단점
1. 동일한 시간 구간끼리 비교하게 되면, 신호의 떨림과 움직임이 심해질수록 어긋나게 된다.
2. 길이가 다른 시계열 분석 불가.
DTW(동적 시간 워핑)을 이용한 시계열 유사도 측정
- 장점
1. 서로 다른 길이의 시계도 유사도 분석 가능
2. 다차원 시계열 데이터의 분석 가능 - 단점
1. 연산비용이 크다.
'machine learning' 카테고리의 다른 글
mvp (0) | 2023.11.22 |
---|---|
scikit-learn 에서 제공하는 피처 스케일러(Scaler) (0) | 2023.05.12 |
scaler 공부 (0) | 2023.02.11 |
Cross Validation (0) | 2023.02.06 |
시계열 모델 (0) | 2023.01.13 |