논문리뷰 · Feb 28, 2026

논문리뷰: From Blind Spots to Gains: Diagnostic‑Driven Iterative Training for Large Multimodal Models

Planner Agent: 목표/계획 수립
Image Selector Agent: 시각 입력 선정
Question Generator Agent: 평가 쿼리 생성
Validation Agent: 품질/정답 검증

한 줄 요약

모델의 약점을 진단→맞춤 데이터 생성→강화학습으로 반복 보완하는 DPE 루프가 LMM 성능을 지속적으로 개선한다.

제목: From Blind Spots to Gains: Diagnostic‑Driven Iterative Training for Large Multimodal Models
저자: Hongrui Jia 외
연도: 2026
링크: https://arxiv.org/abs/2602.22859

대형 멀티모달 모델의 학습은 정적 데이터/고정 레시피에 의존해, 실제 약점(Blind Spot)을 진단하고 맞춤 보완하기 어렵다. 단순한 자기생성 데이터는 품질과 타깃성이 부족하다.

Figure 1: Limits of prior self-evolution frameworks

Figure 2: Overview of the DPE framework

Figure 5: UMAP visualization of data diversity