Processing math: 100%

전체 글 86

[Time-series 논문 리뷰] UniTime: A Language-Empowered Unified Model for Cross-Domain Time Series Forecasting (WWW 2024)

Motivation기존 시계열 예측 모델은 도메인별 전용 학습에 의존해 데이터 간 공통 패턴을 활용하지 못함.도메인 간 데이터 특성 다양성, 혼동 문제, 학습 속도 불균형으로 인해 통합 모델 학습이 어려움.도메인 간 공통 패턴 학습 및 전이를 가능하게 하는 통합적이고 일반화 가능한 모델 필요. Contribution최초의 크로스-도메인 통합 시계열 모델 UniTime 제안자연어 기반 도메인 지침으로 도메인 혼동 해결.마스킹 기법으로 도메인 간 학습 속도 불균형 완화.언어와 시계열 데이터의 통합 학습 구조 설계Language-TS Transformer로 도메인 식별 및 데이터 일반화 구현.  Proposed Method Time Series Tokenizer역할: 시계열 데이터를 전처리하여 모델에 입력할 ..

[Time-series 논문 리뷰] Cross-Domain Contrastive Learning for Time Series Clustering (AAAI 2024)

MotivationRepresentation Learning과 Clustering의 분리 문제기존의 대부분의 시계열 클러스터링 기법은 representation learning 과 clustering과정을 분리하여 수행.이로 인해 클러스터링 손실이 데이터 표현 학습을 효과적으로 안내하지 못함.표현 학습 단계에서 얻어진 특징이 클러스터링에 최적화되지 않을 수 있음.주파수 도메인 정보의 미활용대부분의 기존 기법은 temporal domain 정보만 활용하며, frequency domain 데이터가 가지는 주기적 패턴이나 잡음 제거 특성을 간과.주파수 도메인은 주기적 특징을 더 잘 포착하며, 잡음이나 이상치에 덜 민감함.효율적인 End-to-End 방식의 부재기존방식은 여러 단계를 거쳐 클러스터링 결과를 생성..

[Time-series 논문 리뷰] TGAN-AD: Transformer-Based GAN for Anomaly Detection of Time Series Data

Motivation기존의 이상 탐지 방법은 종종 정확한 레이블이나 명확한 정의가 부족하고, 고차원 데이터를 처리하는 데 한계기존의 GAN 기반 이상 탐지 모델은 시계열 데이터의 문맥 정보를 효과적으로 추출하지 못하는 한계 ContributionTGAN-AD라는 새로운 모델을 제안Transformer 기반 GAN을 이용해 시계열 데이터의 문맥 정보를 효과적으로 추출할 수 있도록 설계.Generator와 Discriminator가 각각 Transformer로 구성되어 시계열 데이터의 시간적 상관관계와 숨겨진 패턴을 효율적으로 학습.Reconstruction Loss와 Discrimination Loss를 동시에 활용해 이상 점수를 계산.세 가지 공개 데이터셋(SWaT, WADI, KDDCup99)에서 실험을..

[Time-series 논문 리뷰] DGTAD: decomposition GAN-based transformer for anomaly detectionin multivariate time series data

Motivation이상탐지 가정 상황복잡하고 고차원적인 데이터 처리비선형적인 시계열 패턴 및 장기적인 시간 의존성 처리노이즈나 복잡한 패턴에 가려진 미세한 이상 탐지 ContributionDGTAD 모델 제안Transformer의 global feature 추출 능력과 GAN의 적대적 학습 기법을 결합한 새로운 이상 탐지 모델.시계열 분해 모듈 설계시계열 데이터를 Trend 와 Seasonality 요소로 분해해 복잡한 패턴을 명확히 구분.Decomp Attention Mechanism분해된 시계열 정보를 기반으로 특정 이상 패턴을 더 효과적으로 강조.다중 생성기(GAN) 사용다양한 시점에서 생성기를 사용해 Mode Collapse 문제 완화 및 일반화 성능 강화.우수한 성능 입증9개 벤치마크 데이터셋에..

[논문 리뷰] Towards Explaining Distribution Shifts (ICML 2023)

방법론의 목적 기존 연구 대부분은 변화가 발생했는지 여부를 탐지하는 데에만 초점을 맞추고 있으며, 탐지된 변화를 인간이 적절히 이해하고 처리할 수 있다고 가정함.이러한 수작업 완화 작업을 지원하기 위해, 원본 분포에서 변환된 분포로 이동을 설명할 수 있도록 함.class distribution shift에 대한 대응 (=ex. 이상일때 shift발생하는데, 정상일때와 뭐가 다르길래 발생하는지 알려줌) 주목해야할 점 Interpretable Transportation Map을 활용하여 분포 변화를 설명하는 방법론 Transportation Map 소스와 타겟 두 분포 사이의 관계를 설명하기 위해, 데이터를 한 분포에서 다른 분포로 변환하는 map ex. 변환 맵이 간단한 수학 공식이나..

[Time-series 논문 리뷰] Explaining Time series via Contrastive and Locally Sparse Perturbations (ICLR 2024)

방법론의 목적 1) 시계열 데이터의 복잡성과 해석의 어려움시계열 데이터의 특성:다차원(multivariate) 데이터: 여러 센서 또는 관찰 데이터가 시간에 따라 변동.시간 패턴: 데이터가 시간적으로 연속적이면서 특정 구간에서 중요한 정보가 나타남.기존 설명 기법:이미지나 텍스트 데이터에 잘 작동하는 설명 기법을 시계열 데이터에 바로 적용하기 어려움.시계열 데이터의 복잡한 시간적 패턴과 연관성을 충분히 반영하지 못함.전역적 접근: 샘플 간 이질성을 반영하지 못함ContraLSP의 필요성:복잡한 시간적 특징을 설명할 수 있는 전용 모델 필요.중요한 시간 구간과 관찰 값을 효과적으로 식별하는 능력 요구.2) 기존 XAI 기법의 한계기존 기법(대표: Saliency Map, Shapley Value, LIME..

[Time-series 논문 리뷰] Large language models can be zero-shot anomaly detectors for time series? (DSAA 2024)

본 논문에서는 LLM을 활용하여 시계열 데이터에서 이상 탐지하는 방법을 제안하는데, 이를 위해 SIGLLM이라는 프레임워크 개발함. SIGLLM은 시계열 데이터를 text형식으로 변환해 LLM에 입력하고, 이를 기반으로 2가지 접근법을 사용하여 이상을 탐지함. (PROMPTER, DETECTOR) 1. 시계열 데이터 변환 과정 (LLMTIME과 유사)시계열 데이터를 LLM이 처리할 수 있도록 하기 위해 몇가지 전처리 과정을 거침.1) 스케일링(Scaling)- 데이터의 최솟값을 기준으로 값을 이동하여 비음수로 변환함.- 예를 들어, X=(x1,x2,...,xT)가 주어지면, 각 데이터 포인트에 대해 xt=xtmin(X)로 변환해 음수를 제거하고 데이터의 범위 조절 2)..

[Time-series 논문 리뷰] DACAD: Domain Adaptation Contrastive Learning for Anomaly Detection in Multivariate Time Series

문제 설정- DACAD는 라벨이 없는 타겟 시계열 데이터셋 T에서 라벨이 있는 소스 데이터셋 S를 사용하여 이상탐지하는 모델- 소스 데이터는 정상과 이상 라벨O, 타겟 데이터는 라벨X Anomaly Injection- 타겟 데이터에 라벨이 없기에, DACAD는 이상 주입 방법으로 합성된 이상을 만들어냄- 이 과정에서 소스 데이터의 정상 샘플 Snorm과 타겟 데이터 T에 합성 이상을 추가하여 새로운 샘플 집합 SinjTinj를 생성함- 모델이 다양한 유형의 이상 학습하는데에 도움됨 TCN- TCN을 통해 시계열 window의 주요 특징 추출- 변환된 특징 공간에서 4가지로 나눌 수 있음- φR(S) : 소스 window의 representation- $\va..