- http-bridge.ts: add req.setEncoding('utf8') to all POST handlers
to fix Korean text corruption in pending/chat/dump payloads
- observer-script.ts: add inline pre-strip in cleanLines() for
Material icon names concatenated by textContent without newlines
- observer-script.ts: apply cleanLines() to codeText extraction
- known-issues: document UTF-8 encoding and noise filter issues
1.1 KiB
1.1 KiB
DOM Observer 데이터 품질 검증 + UTF-8/noise 수정
- 시간: 2026-04-13 12:34~12:52
- Commit:
pending - Vikunja: #619, #620 (진행 중)
검증 결과
- DOM Observer v8 동작 확인:
pending/에 45개 시그널 생성됨 (source: "dom_observer") - 버튼 분류 정상:
command(30),permission(15) - 명령어/conversation_id/버튼(Allow/Deny/Cancel) 추출 정상
- 한글 인코딩 깨짐 발견: description 필드에
[AI 본문 요약]→[AI <20> <20>]
변경 사항 (v0.5.39)
http-bridge.ts
- 모든 POST 핸들러에
req.setEncoding('utf8')추가 - Node.js HTTP 서버의 Buffer→string latin1 기본 인코딩으로 인한 multi-byte UTF-8 손실 수정
observer-script.ts
cleanLines()에 인라인 pre-strip 추가: Material 아이콘명 18종을 regex로\n으로 치환Thought for Xs패턴 인라인 제거 추가codeText추출에cleanLines()적용 (이전 미적용)
미완료
- AG 재시작 후 v0.5.39 적용 검증 (한글 정상 출력 확인)
- DOM dump 추출 검증
- Discord 릴레이 E2E 검증