Files
gravity_control/docs/devlog/entries/20260413-002.md
Variet Worker 2a1ebf1020 fix(extension): UTF-8 encoding + noise filter enhancement (v0.5.39)
- http-bridge.ts: add req.setEncoding('utf8') to all POST handlers
  to fix Korean text corruption in pending/chat/dump payloads
- observer-script.ts: add inline pre-strip in cleanLines() for
  Material icon names concatenated by textContent without newlines
- observer-script.ts: apply cleanLines() to codeText extraction
- known-issues: document UTF-8 encoding and noise filter issues
2026-04-13 12:56:25 +09:00

1.1 KiB
Raw Blame History

DOM Observer 데이터 품질 검증 + UTF-8/noise 수정

  • 시간: 2026-04-13 12:34~12:52
  • Commit: pending
  • Vikunja: #619, #620 (진행 중)

검증 결과

  • DOM Observer v8 동작 확인: pending/에 45개 시그널 생성됨 (source: "dom_observer")
  • 버튼 분류 정상: command(30), permission(15)
  • 명령어/conversation_id/버튼(Allow/Deny/Cancel) 추출 정상
  • 한글 인코딩 깨짐 발견: description 필드에 [AI 본문 요약][AI <20> <20>]

변경 사항 (v0.5.39)

http-bridge.ts

  • 모든 POST 핸들러에 req.setEncoding('utf8') 추가
  • Node.js HTTP 서버의 Buffer→string latin1 기본 인코딩으로 인한 multi-byte UTF-8 손실 수정

observer-script.ts

  • cleanLines()에 인라인 pre-strip 추가: Material 아이콘명 18종을 regex로 \n으로 치환
  • Thought for Xs 패턴 인라인 제거 추가
  • codeText 추출에 cleanLines() 적용 (이전 미적용)

미완료

  • AG 재시작 후 v0.5.39 적용 검증 (한글 정상 출력 확인)
  • DOM dump 추출 검증
  • Discord 릴레이 E2E 검증