2024/04 21

[Time-series 논문 리뷰] FluxEV: A Fast and Effective Unsupervised Framework for Time-Series Anomaly Detection(WSDM, 2021)

Abstract기존 연구 한계엄청난 양의 데이터, 복잡한 데이터 패턴, 그리고 제한된 계산 자원SPOT은 효율적인 스트리밍 알고리즘이지만, 전체 데이터 분포에서 극단적인 값에만 민감제안하는 것: FluxEV빠르고 효과적인 비감독 이상 감지 프레임워크비극단적 이상을 극단적 값으로 변환SPOT의 한계를 해결하고 탐지 정확도에서 엄청난 향상

[Time-series 논문 리뷰] Unsupervised Time Series Outlier Detection with Diversity-Driven Convolutional Ensembles(PVLDB, 2022)

Abstract기존 연구 한계정확성, 효율성 측면에서 개선의 여지 O제안: 다양성 중심의 convolution ensemble정확성 향상: 시계열의 시간적 의존성을 포착할 수 있는 컨볼루션 시퀀스 대 시퀀스 오토인코더를 기반으로 한 다수의 기본 이상치 탐지 모델을 사용기본 모델들 사이의 다양성을 유지하여 앙상블의 정확성을 향상시키는 것을 목표효율성 향상: 훈련 도중 높은 수준의 병렬 처리, 한 기본 모델에서 다른 모델로 일부 모델 매개변수를 전송할 수 있어 훈련 시간을 줄임

[Time-series 논문 리뷰] Prototype-oriented unsupervised anomaly detection for multivariate time series(ICML, 2023)

Abstract기존 다변량 시계열 unsupervised anomaly detection 문제점각 다변량 시계열에 대해 고정된 매핑 세트 학습하고자 함→ 많은 비용, 제한된 모델 적응 수반해결법확률적 프레임워크 하에 프로토타입 중심의 PUAD 제안각 MTS에 대한 매핑을 학습하는 대신, 여러 MTS를 정상 패턴의 다양한 세트를 대표하는 프로토타입 그룹의 분포로 봄

[Time-series 논문 리뷰] When Model Meets New Normals: Test-time Adaptation for Unsupervised Time-series Anomaly Detection(AAAI, 2024)

0. Abstract시계열 이상 감지관측치의 시퀀스로부터 정상성을 학습하여 이상한 시간 단계를 탐지하는 문제를 다룸정상성시간이 지남에 따라 발전하여, 훈련 데이터와 테스트 데이터 사이의 분포 변화로 인해 정상성의 분포가 변할 수 있는 "새로운 정상 문제"를 야기⇒ 비지도 시계열 이상 감지 연구에서 새로운 정상 문제의 유병률을 강조제안점trend 추정 중에 새로운 정상성을 학습하기 위한 self-supervised 접근 방식을 기반으로 한 단순하지만 효과적인 테스트 시간 적응 전략을 제안1. Introduction[1] 비지도 시계열 이상 감지 모델비지도 시계열 이상 감지 모델사용 가능한 훈련 데이터셋에서 정상 패턴을 학습하는 것에 중점정상성 개념; 시간이 지남..

[Time-series 논문 리뷰] ANOMALY TRANSFORMER: TIME SERIES ANOMALY DETECTION WITH ASSOCIATION DISCREPANCY(ICLR, 2022)

0. Abstract시계열 비지도 이상 탐지기존 방법들(둘다 잘 안됨) pointwise representation, pairwise association(transformer) 통합모델링: pointwise representation+pairwise association각 timepoint의 self attention weight분포 → 전체 series와의 풍부한 연관성 내포가능이 연구에서의 문제 정의이상이 드물기에, anomaly point로부터 전체 series에 대한 중요한 연관성 구축 어려움따라서 전체보단, 주로 인접한 time point들과 연관성 집중될 것 (=인접 집중 편향)(이 연구에서,,) 정상과 이상점들 사이의 구별가능한 연관성 기준 내포**(=연광..

[Time-series 논문 리뷰] Revisiting VAE for Unsupervised Time Series Anomaly Detection: A Frequency Perspective (KDD,2024)

ABSTRACT시계열 이상 감지의 중요성: 웹 시스템은 실시간으로 이상을 감시하고 식별하기 위해 시계열 데이터에 의존합니다. 이는 시스템의 진단과 복구 절차를 시작하는 데 중요한 역할을 합니다.VAE의 인기와 한계: 변이형 오토인코더(VAE)는 우수한 노이즈 제거 능력으로 인해 이상 감지 분야에서 인기를 얻었습니다. 그러나 VAE 기반 방법은 장기간의 이질적 패턴과 단기간 trend를 동시에 포착하는 데 어려움을 겪습니다.FCVAE의 제안: 이러한 도전을 극복하기 위해, 단변량 시계열 데이터를 위한 주파수 강화 조건부 변이형 오토인코더(FCVAE)라는 새로운 비지도 학습 이상 감지 방법을 제안합니다.혁신적 접근 방식: FCVAE는 조건부 변이형 오토인코더의 조건에 전역 및 지역 주파수 특성을 동..

[서베이 정리] Anomaly detection in streaming data: A comparison and evaluation study

0. Abstract스트리밍 데이터의 이상 탐지는 전통적인 방법들로는 처리하기 어려운 복잡성을 가지고 있음스트리밍 데이터의 주요 도전 과제에 대응하기 위해 8개의 최신 알고리즘을 테스트하고 평가연구 결과는 알고리즘 선택에 있어 데이터의 지역성, 상대성, 개념 변화와 같은 특성이 중요한 영향을 미친다는 것을 보여줌locality이상치가 지역적 맥락에 상대적인지 여부)relativeness과거 데이터가 이상치를 정의하는지 여부concept drift그 강도와 빈도⇒ 대부분의 경우 사전에 역사적 데이터와 도메인 지식을 통해 추론될 수 있음실제 환경에서 스트리밍 데이터의 이상 탐지를 위한 중요한 발견을 제공1. Introduction[1] 데이터 스트림 vs 다변..

[Deep-Learning 개념] 최대 평균 불일치(MMD)

MMD정의확률 분포 간의 차이를 측정하는 효과적 방법 중 하나역할데이터셋 간의 차이를 수치화 하기 위한 역할활용Domain Adaptation, 커널기반 방법, 생성 모델링 MMD정의두 확률 분포간의 차이점을 평가하기 위해 고안된 측정지표핵심커널함수를 선정하는 작업기본 아이디어재생 커널 힐베르트 공간(RKHS)에서 분포의 평균 임베딩 차이를 계산하는 것힐베이트: 무한차원의 공간임베딩: 각 데이터에 일대일대응하는 벡터뭉치⇒ 고차원 공간에서 함수의 기댓값(평균)간의 불일치 평가하여 차이점을 정량화MMD 구성요소커널 함수입력 공간의 데이터포인트를 고차원공간에 변환하는 역할결정경계가 단순한 초평면이 아닌 복잡한 문제를 해..

[Manufacturing 논문 리뷰] Multi-Layer domain adaptation method for rolling bearing fault diagnosis

0. Abstract레이블이 지정된 훈련 데이터(소스 도메인)의 분포가 **레이블이 없는 테스트 데이터(타겟 도메인)**의 분포와 다르다는 도메인 이동 문제가 일반적으로 발생제안점(롤링 베어링 결함진단 위한 새로운 도메인 적응 방법)Deep CNN 사용됨다중 레이어에서 두 도메인 간의 다중 커널 최대 평균차이(MMD) 최소화하여,소스 도메인에서 supervised learning 통해 학습된 표현이 타겟 도메인에 적용될수있도록⇒ 도메인 불변 특징 효율적 추출가능 & cross domain 성능 크게 향상 가능1. Introduction[1] rolling element bearing과 domain shift 문제 정의rolling element bearing중공업 기계, 제..