[카테고리:] Paper Review
-
[논문리뷰] Instant Video Models: Universal Adapters for Stabilizing Image-Based Networks (2025 NeurIPS)
이번에 리뷰할 논문은 2025 NeurIPS에 발표된 “Instant Video Models: Universal Adapters for Stabilizing Image-Based Networks” 이라는 논문이다. 이 논문은 이미지 기반으로 학습된 딥러닝 모델을 이용해서 비디오에서 추론을 할때 어떻게 안정화(Stabilization)을 시킬 수 있는지 연구한 논문이다. 특히 입력 비디오에 노이즈같은 시간에 따라 변화하는 degradation이 존재하면 이를 복원하는 이미지 기반 모델을 그대로 적용할때 프레임 하나하나는 잘 복원된것처럼…
-
How to use text for image restoration
Image restoration 분야에서 text를 어떻게 이용할 수 있는지/이용하고 있는지 간단하게 정리하고 관련 논문을 간단히 정리한 자료입니다. low-level vision에서 text를 이용하는 방법을 크게 아래와 같이 4가지로 나누었습니다. 그리고 3번에 해당하는 논문으로 “Improving Image Restoration through Removing Degradations in Textual Representations”, 4번에 해당하는 논문으로 “Beyond Pixels: Text Enhances Generalization in Real-World Image Restoration”을 정리하였습니다. 첫번째 논문같은 경우에는…
-
Rethinking Image Evaluation
기존 Image Evaluation 방법들에 대한 간략한 소개와 2025 CVPR에서 발표됐던 관련 최신 논문에 대한 간단한 정리를 한 자료입니다. 논문은 각각 “Toward Generalized Image Quality Assessment: Relaxing the Perfect Reference Quality Assumption” “Augmenting Perceptual Super-Resolution via Image Quality Predictors” 입니다. 첫번째 논문은 Image Quality를 평가할때 평가의 기준인 ground truth로 사용하는 이미지의 quality가 항상 좋지 않고 오히려…
-
[논문리뷰] One-Step Effective Diffusion Network for Real-World Image Super-Resolution (2024 NuerIPS)
Introduction & Related Work 2024년 NeurIPS에 발표된 “One-Step Effective Diffusion Network for Real-World Image Super-Resolution” (OSEDiff)를 리뷰해보려 한다. 이 논문은 실세계 이미지 초해상도(Real-ISR) task를 one step diffusion모델로 해결하려는 논문이다. 기본적으로 최근 super resolution task는 diffusion 모델이 접목되기 시작하면서 perceptual한 퀄리티가 눈에띄게 향상했다. 관련 논문으로는 SUPIR(Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration…
-
[논문리뷰] PromptFix: You Prompt and We Fix the Photo (2024 NeurIPS)
Introduction 2024 뉴립스에 발표된 논문이고 instrucrtion을 기반으로 low-level vision task를 수행하는 논문이다. 이전에 포스트한 instructIR과 비슷한 느낌인데 instructIR에서는 단순 unet으로 image를 바로 뽑아냈다면 이 논문에서는 diffusion을 활용한것이 첫번째 차이점이고, instrcutIR에서는 instruction이 거의 classification용으로만 거의 쓰였는데 이 논문에서는 task중에 object removal같은 editing task가 있어서 이를 위해 instruction에서 단순 task정보 이외에도 문맥의 정보를 디테일하게 얻어야한다는 점이 두번째…