feat(pipeline): v3-v4 dedup + panorama stitching + 1080p support
- HSV-aware _trim_to_content (white ratio 30-97%) - pHash cluster dedup: dHash 32x32(1024bit), max_hamming=20 - Panoramic stitching: template matching scroll offset detection - 4-stage pipeline: MSE -> Panorama -> pHash - 1080p download priority + MAX_FRAME_WIDTH=1280 cap - test_pipeline.py with YouTube URLs and --download mode - 3 new known-issues documented - devlog + STATUS.md updated
This commit is contained in:
@@ -4,26 +4,38 @@
|
||||
|
||||
| 기능 | 상태 | 비고 |
|
||||
|------|------|------|
|
||||
| YouTube 다운로드 | ✅ 완료 | yt-dlp + 쿠키 인증 |
|
||||
| 프레임 추출 | ✅ 완료 | fps=2 기본값 |
|
||||
| YouTube 다운로드 | ✅ 완료 | yt-dlp, 1080p 우선 다운로드 |
|
||||
| 프레임 추출 | ✅ 완료 | fps=2, MAX_FRAME_WIDTH=1280 캡 |
|
||||
| 패턴 감지 (overlay) | ✅ 완료 | Tab 라인 검증 포함 |
|
||||
| 패턴 감지 (split) | ✅ 완료 | 밝기 기준 엄격화 |
|
||||
| 패턴 감지 (scroll) | ✅ 완료 | 기본 폴백 |
|
||||
| MSE 기반 중복 제거 | ✅ 완료 | 히스토그램 → MSE 전환 |
|
||||
| 오버레이 정규화 비교 | ✅ 완료 | 320×120 정규화 + 슬라이딩 윈도우 |
|
||||
| HSV 기반 Tab 검출 | ✅ 완료 | 2-tier HSV 마스크, 960px 업스케일 |
|
||||
| MSE 기반 중복 제거 | ✅ 완료 | 480px 정규화 비교 |
|
||||
| pHash 클러스터 중복제거 | ✅ 완료 | dHash 32×32(1024bit), max_hamming=20 |
|
||||
| 파노라마 스티칭 | ✅ 완료 | 템플릿 매칭 수평 스크롤 합성 |
|
||||
| 오버레이 정규화 비교 | ✅ 완료 | 480×180 정규화 + 전체 히스토리 MSE 비교 |
|
||||
| PDF/PNG 생성 | ✅ 완료 | A4 + 롱 이미지 |
|
||||
|
||||
## 처리 파이프라인 (scroll)
|
||||
|
||||
```
|
||||
Raw Frames → HSV Strip 검출 → Median Crop → MSE 1차 → 파노라마 스티칭 → pHash 2차 → PDF
|
||||
```
|
||||
|
||||
## 최근 변경
|
||||
|
||||
| 날짜 | 변경 내용 |
|
||||
|------|-----------|
|
||||
| 2026-03-25 | 1080p 우선 다운로드 + MAX_FRAME_WIDTH=1280 캡 (OOM 방지) |
|
||||
| 2026-03-25 | dHash 32×32 + max_hamming=20으로 pHash 정밀도 향상 |
|
||||
| 2026-03-25 | 파노라마 스티칭: 템플릿 매칭 스크롤 오프셋 검출 + 연속 프레임 합성 |
|
||||
| 2026-03-25 | HSV 트림: 흰색비율 30~97% 기반 정밀 크롭 |
|
||||
| 2026-03-25 | overlay 프레임 수 최적화: 858→51프레임 (OVERLAY_SIMILARITY_THRESHOLD=0.55) |
|
||||
| 2026-03-24 | 패턴 감지 고도화: overlay→split→scroll 우선순위 |
|
||||
| 2026-03-24 | 히스토그램 비교 → MSE 픽셀 비교로 전환 |
|
||||
| 2026-03-24 | split 모드: 42% 크롭 + 밝기 필터 + Tab 라인 검증 |
|
||||
| 2026-03-24 | overlay 모드: 정규화 + 슬라이딩 윈도우 중복 제거 |
|
||||
| 2026-03-24 | split 감지 조건 엄격화 (top>180, bottom<100) |
|
||||
|
||||
## 알려진 제한사항
|
||||
|
||||
- 오버레이형 영상(空奏列車)에서 추출 프레임 수가 아직 많을 수 있음 (MSE 임계값 추가 튜닝 필요)
|
||||
- 영상 내 Tab이 반복되는 곡은 실제 고유 프레임 수가 적음 (正常 동작)
|
||||
- 1080p 처리 시 여전히 중복 프레임 존재 가능 (마디번호 기반 추가 검증 필요)
|
||||
- 순차 영상 처리 시 메모리 누적 주의 (gc.collect 필수)
|
||||
- test_pipeline.py 아직 메인 코드와 완전 통합 안 됨
|
||||
|
||||
Reference in New Issue
Block a user