딩딩딩2

A Survey on Test-Time Scaling in Large Language Models: What, How, Where, and How Well

2025 딥러닝/논문 리뷰 2025.08.23

[논문 리뷰] LIMO: Less is More for Reasoning (COLM 2025)

방법론의 목적 복잡한 추론능력을 적은 양의 데이터로도 효과적으로 유도하기 위함Contribution사전 학습된 LLM의 지식 내재화 수준을 최대화복잡한 문제 해결을 유도할 수 있는 고품질 reasoning 예시를 최소한으로 설계대규모 데이터 없이도 경쟁력 있는 추론 성능을 실현할 수 있음을 보여줌⇒ 기존의 “데이터 양 = 성능”이라는 등식을 깨고, ”모델이 이미 알고있는 지식을 효율적으로 끌어내는 방향”으로 학습 방법 재정의 주목해야할 점고품질 데이터 구성 전략 (Curated Dataset Design)817개의 문제만 사용했지만, 이 문제들은 모두 고도로 선별된 것다양한 사고 경로와 지식 통합을 유도할 수 있고,정확한 reasoning chain을 동반하며,교육적 가치와 일반화 가능성을 지닌 문제들..

2025 딥러닝/논문 리뷰 2025.08.23

[논문 리뷰] AUGCO: Augmentation Consistency-guided Self-training for Source-free Domain Adaptive Semantic Segmentation

방법론의 목적문제 정의소스 도메인의 데이터 접근 없이(unavailable source data) semantic segmentation 모델을 타겟 도메인에 적응시키는 source-free domain adaptation 문제를 해결.목표Source-free domain adaptation (SFDA): 오직 사전 학습된 모델 파라미터와 라벨 없는 타겟 데이터만으로 타겟 도메인에 적응하는 것이 목적.하지만 naive self-training은 초기 예측 오류를 강화하는 문제(error accumulation) 발생.따라서 "신뢰할 수 있는 예측만 선택적으로 학습"해야 함. 주목해야할 점 (Key Insights)Source-free setting이기 때문에 source data 없이 adaptation..

2025 딥러닝/논문 리뷰 2025.08.23

[논문 리뷰] Tent: Fully Test-time Adaptation by Entropy Minimization (ICLR 2021)

방법론의 목적문제정의현실 문제: 딥러닝 모델은 훈련 데이터와 유사한 분포에서는 높은 정확도를 보이지만, 도메인 시프트가 발생하면 성능이 크게 하락. 예) 카메라 노이즈, 날씨 변화, 센서 고장 등.기존 한계: 일반적인 도메인 적응 방법은 소스 도메인 데이터를 다시 사용하거나, 테스트 환경을 미리 아는 경우에만 유효함.현실적 제약: 테스트 시점에는 소스 데이터 접근이 불가능하거나 비용이 많이 드는 경우가 많음 (예: 개인정보보호, 제한된 리소스, 지연 시간 이슈 등)목표Fully Test-Time Adaptation (FTTA): 사전 훈련된 모델의 구조와 가중치는 유지하며, 테스트 배치에서만 적응 수행: 소스 데이터 없이, 테스트 시점의 입력 데이터만으로 모델이 환경 변화에 적응하도록 만드는 방법론 제안..

2025 딥러닝/논문 리뷰 2025.08.23

[논문 리뷰] s1: Simple test-time scaling (arXiv 2025)

📍 본 내용은 논문 발표를 위해 정리한 자료입니다.

2025 딥러닝/논문 리뷰 2025.05.17

[논문 리뷰] Parameter-free Online Test-time Adaptation (CVPR 2022)

📍 본 내용은 연구실에서 논문세미나 발표를 위해 정리한 자료입니다.

2025 딥러닝/논문 리뷰 2025.03.12

[논문 리뷰] Continual Test-Time Domain Adaptation (CVPR 2022)

📍 본 내용은 연구실에서 논문세미나 발표를 위해 정리한 자료입니다.

2025 딥러닝/논문 리뷰 2025.03.12

[Time-series 논문 리뷰] UniTime: A Language-Empowered Unified Model for Cross-Domain Time Series Forecasting (WWW 2024)

Motivation기존 시계열 예측 모델은 도메인별 전용 학습에 의존해 데이터 간 공통 패턴을 활용하지 못함.도메인 간 데이터 특성 다양성, 혼동 문제, 학습 속도 불균형으로 인해 통합 모델 학습이 어려움.도메인 간 공통 패턴 학습 및 전이를 가능하게 하는 통합적이고 일반화 가능한 모델 필요. Contribution최초의 크로스-도메인 통합 시계열 모델 UniTime 제안자연어 기반 도메인 지침으로 도메인 혼동 해결.마스킹 기법으로 도메인 간 학습 속도 불균형 완화.언어와 시계열 데이터의 통합 학습 구조 설계Language-TS Transformer로 도메인 식별 및 데이터 일반화 구현. Proposed Method Time Series Tokenizer역할: 시계열 데이터를 전처리하여 모델에 입력할 ..

2025 딥러닝/Time-series 논문 리뷰 2025.03.12

[Time-series 논문 리뷰] Cross-Domain Contrastive Learning for Time Series Clustering (AAAI 2024)

MotivationRepresentation Learning과 Clustering의 분리 문제기존의 대부분의 시계열 클러스터링 기법은 representation learning 과 clustering과정을 분리하여 수행.이로 인해 클러스터링 손실이 데이터 표현 학습을 효과적으로 안내하지 못함.표현 학습 단계에서 얻어진 특징이 클러스터링에 최적화되지 않을 수 있음.주파수 도메인 정보의 미활용대부분의 기존 기법은 temporal domain 정보만 활용하며, frequency domain 데이터가 가지는 주기적 패턴이나 잡음 제거 특성을 간과.주파수 도메인은 주기적 특징을 더 잘 포착하며, 잡음이나 이상치에 덜 민감함.효율적인 End-to-End 방식의 부재기존방식은 여러 단계를 거쳐 클러스터링 결과를 생성..

2025 딥러닝/Time-series 논문 리뷰 2025.03.12

[Time-series 논문 리뷰] TGAN-AD: Transformer-Based GAN for Anomaly Detection of Time Series Data

Motivation기존의 이상 탐지 방법은 종종 정확한 레이블이나 명확한 정의가 부족하고, 고차원 데이터를 처리하는 데 한계기존의 GAN 기반 이상 탐지 모델은 시계열 데이터의 문맥 정보를 효과적으로 추출하지 못하는 한계 ContributionTGAN-AD라는 새로운 모델을 제안Transformer 기반 GAN을 이용해 시계열 데이터의 문맥 정보를 효과적으로 추출할 수 있도록 설계.Generator와 Discriminator가 각각 Transformer로 구성되어 시계열 데이터의 시간적 상관관계와 숨겨진 패턴을 효율적으로 학습.Reconstruction Loss와 Discrimination Loss를 동시에 활용해 이상 점수를 계산.세 가지 공개 데이터셋(SWaT, WADI, KDDCup99)에서 실험을..

2025 딥러닝/Time-series 논문 리뷰 2025.03.12

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

딩딩딩2

전체 글 91

티스토리툴바