2024 딥러닝/Time-series 논문 리뷰

[Time-series 논문 리뷰] Dish-TS: A General Paradigm for Alleviating Distribution Shift in Time Series Forecasting(AAAI, 2023)

융딩2 2024. 4. 24. 17:27

0. Abstract

  • series분포변화 해결하는 기존 연구 한계
    • 대부분 분포의 정량화에 한정
    • lookback window, horizon windows 사이의 잠재적 변화 간과
  • 분포 변화 정의
    • 룩백 창을 입력 공간으로, 수평 창을 출력 공간으로 간주할 때,
    • (i) 입력 공간 내에서 시간이 지남에 따라 지속적으로 변화하는 내부 공간 변화
    • (ii) 입력 공간과 출력 공간 사이에서 변화하는 외부 공간 변화가 존재
  • 제안하는 것: Dish-TS
    • CONET: 더 나은 분포 추정을 위해, 우리는 입력 시퀀스를 학습 가능한 분포 계수로 매핑할 수 있는 어떠한 신경 구조도 가능
    • Dual-CONET 프레임워크: 내부 공간과 외부 공간 변화를 완화하기 위해, 우리는 Dish-TS를 Dual-CONET 프레임워크로 구성하여 입력 및 출력 공간의 분포를 별도로 학습하며, 이는 자연스럽게 두 공간의 분포 차이를 포착

1. Introduction

  • TSF의 분포변화
    • 입력 공간으로서의 룩백 창(간단히 '룩백'이라고 함)과 모델의 출력 공간으로서의 수평 창(간단히 '수평'이라고 함)
    • (i) 내부 공간 변화: 시간이 지남에 따라 시계열 분포가 변하여 입력 공간(룩백) 내 데이터가 변화
    • (ii) 외부 공간 변화: 입력 공간(룩백)과 출력 공간(수평) 사이에 분포가 변합니다.
  • 기존 연구들의 한계
    • 1) TSF에서 내부 공간의 분포 정량화는 신뢰할 수 없습니다.
      • 시계열은 이상적으로는 진정한 분포에서 지속적으로 생성되지만, 실제 관측 데이터는 특정 기록 빈도로 센서를 통해 이산적으로 샘플링
      • 기존 작업들은 항상 series 정규화 or 재조정
      • = 관측 데이터에서 경험적으로 얻은 고정통계(평균, 표준편차) 사용하여 분포 정량화 & 이 통계로 series분포 정규화
      • 그러나, 이 경험적 통계 신뢰X → 이후 분포 나타내는데 표현력 제한
        • ex. 시계열 기록 빈도에 의해 분포가 달라짐
    • 2) TSF의 외부 공간 변화는 간과되고 있습니다.
      • 기본적으로, 시계열 예측에서 입력 시퀀스(룩백)와 출력 시퀀스(수평)를 두 개의 공간으로 고려할 때, 기존 연구들은 항상 입력 공간과 출력 공간이 기본적으로 동일한 분포를 따른다고 가정합니다(Ogasawara et al. 2010; Passalis et al. 2019; Du et al. 2021).
      • RevIN
        • 입력을 정규화하고 출력을 비정규화함으로써 인스턴스를 정렬하려고 시도하지만, 여전히 룩백과 수평이 동일한 통계적 특성을 공유한다는 강한 가정을 두고 있으며, 따라서 동일한 분포를 가진다고 합니다.
        • 그럼에도 불구하고, 입력 공간과 출력 공간 사이에는 항상 분포의 변동이 있습니다.
      • 외부 공간 변화를 간과하는 것은 입력 공간과 출력 공간 사이의 격차를 무시함으로써 예측 성능을 저해합니다.