- 5단계 파이프라인: 다운로드 → 프레임 추출 → 패턴 감지 → 중복 제거 → PDF 생성 - 3가지 패턴 지원: overlay, split, scroll - MSE 기반 픽셀 비교 프레임 중복 제거 - split 모드: 42% 크롭 + 밝기 필터 + Tab 라인 검증 - overlay 모드: 320x120 정규화 + 슬라이딩 윈도우 비교 - 프로젝트 문서 초기 작성 (architecture, tech-stack, STATUS, known-issues)
1.4 KiB
1.4 KiB
패턴 감지 고도화 & MSE 비교 전환
- 시간: 2026-03-24 22:00~23:20
- Commit:
init(첫 커밋)
결정 사항
1. 패턴 감지 우선순위: overlay → split → scroll
- overlay가 가장 구체적(흰 박스 + Tab 라인)이므로 최우선 검사
- split은 밝기 기준이 느슨할 수 있어 overlay 이후에 검사
- 이전 문제: split을 먼저 검사하면 밝은 배경의 overlay 영상(空奏列車)이 split으로 오분류됨
2. 히스토그램 → MSE 비교 전환
- 히스토그램 상관관계는 밝기 분포만 비교하여 서로 다른 Tab 페이지도 "동일"로 판정
- MSE 픽셀 비교는 실제 내용 변화(프렛 번호, 마디 위치)를 정확히 감지
- MSE 스케일 팩터: 8 (동일 프레임 sim>0.999, 커서 이동
0.995, Tab 전환 0.520.91)
3. split 감지 조건 엄격화
- top_brightness > 180 (Tab 용지는 거의 흰색)
- bottom_brightness < 100 (핸드캠은 어두움)
- 차이 > 80
- Tab 수평 라인 4개 이상
4. overlay 정규화 비교
- 오버레이 크롭은 프레임마다 바운딩박스 크기가 다름 (69~360px)
- 320×120 흰색 캔버스에 정규화 후 비교
- 슬라이딩 윈도우 (최근 5개 고유 프레임) 사용
미완료
- overlay형(空奏列車)의 추출 프레임 수 최적화 (현재
1000개, 목표 2050개) - MSE 임계값 추가 튜닝 필요
- 추가 영상 타입 테스트 (순수 스크롤형)