0. Abstract
- series분포변화 해결하는 기존 연구 한계
- 대부분 분포의 정량화에 한정
- lookback window, horizon windows 사이의 잠재적 변화 간과
- 분포 변화 정의
- 룩백 창을 입력 공간으로, 수평 창을 출력 공간으로 간주할 때,
- (i) 입력 공간 내에서 시간이 지남에 따라 지속적으로 변화하는 내부 공간 변화
- (ii) 입력 공간과 출력 공간 사이에서 변화하는 외부 공간 변화가 존재
- 제안하는 것: Dish-TS
- CONET: 더 나은 분포 추정을 위해, 우리는 입력 시퀀스를 학습 가능한 분포 계수로 매핑할 수 있는 어떠한 신경 구조도 가능
- Dual-CONET 프레임워크: 내부 공간과 외부 공간 변화를 완화하기 위해, 우리는 Dish-TS를 Dual-CONET 프레임워크로 구성하여 입력 및 출력 공간의 분포를 별도로 학습하며, 이는 자연스럽게 두 공간의 분포 차이를 포착
1. Introduction
- TSF의 분포변화
- 입력 공간으로서의 룩백 창(간단히 '룩백'이라고 함)과 모델의 출력 공간으로서의 수평 창(간단히 '수평'이라고 함)
- (i) 내부 공간 변화: 시간이 지남에 따라 시계열 분포가 변하여 입력 공간(룩백) 내 데이터가 변화
- (ii) 외부 공간 변화: 입력 공간(룩백)과 출력 공간(수평) 사이에 분포가 변합니다.
- 기존 연구들의 한계
- 1) TSF에서 내부 공간의 분포 정량화는 신뢰할 수 없습니다.
- 시계열은 이상적으로는 진정한 분포에서 지속적으로 생성되지만, 실제 관측 데이터는 특정 기록 빈도로 센서를 통해 이산적으로 샘플링
- 기존 작업들은 항상 series 정규화 or 재조정
- = 관측 데이터에서 경험적으로 얻은 고정통계(평균, 표준편차) 사용하여 분포 정량화 & 이 통계로 series분포 정규화
- 그러나, 이 경험적 통계 신뢰X → 이후 분포 나타내는데 표현력 제한
- ex. 시계열 기록 빈도에 의해 분포가 달라짐
- 1) TSF에서 내부 공간의 분포 정량화는 신뢰할 수 없습니다.
-
- 2) TSF의 외부 공간 변화는 간과되고 있습니다.
- 기본적으로, 시계열 예측에서 입력 시퀀스(룩백)와 출력 시퀀스(수평)를 두 개의 공간으로 고려할 때, 기존 연구들은 항상 입력 공간과 출력 공간이 기본적으로 동일한 분포를 따른다고 가정합니다(Ogasawara et al. 2010; Passalis et al. 2019; Du et al. 2021).
- RevIN
- 입력을 정규화하고 출력을 비정규화함으로써 인스턴스를 정렬하려고 시도하지만, 여전히 룩백과 수평이 동일한 통계적 특성을 공유한다는 강한 가정을 두고 있으며, 따라서 동일한 분포를 가진다고 합니다.
- 그럼에도 불구하고, 입력 공간과 출력 공간 사이에는 항상 분포의 변동이 있습니다.
- 외부 공간 변화를 간과하는 것은 입력 공간과 출력 공간 사이의 격차를 무시함으로써 예측 성능을 저해합니다.
- 2) TSF의 외부 공간 변화는 간과되고 있습니다.