Placeholder. Recognition output с bounding-box координатами на странице → visual validation interface для review правильности распознавания. Ильдар исследовал и достиг успеха, создал прототип интерфейса.

Зачем

  • Visual link между PDF и распознанным параметром на этапе review
  • Ground truth для evaluation — corner-case detection (“что-то не там распознано”)
  • Альтернатива text-queue (loinc-unification-direction OCR validation flow в RFC-012, который никогда не был deployed) — bounding box даёт более прямой UX

Что есть

  • Branch: feat/universal-bbox-editor (BG-1059) — rebased feat/fact-extraction-rebase
  • Реализация: apps/benchmark (universal fact-based extraction + bbox editor + Annotate UI с fact-adapter), packages/ocr-core (fact-extraction strategy)
  • 5 коммитов Ильдара (Mar 29 — Apr 1):
    • feat(benchmark): universal fact-based extraction + bbox editor
    • feat(ocr-core): add fact-extraction strategy
    • feat(benchmark): wire fact-adapter into Annotate UI + switch to Gemini
    • feat(benchmark): model selection for fact-extraction strategy
    • feat(benchmark): fact-extraction-bbox strategy + fix Annotate facts display
  • Связано с fact-based-recognition — fact-based output естественно несёт bbox координаты на каждый fact

Что нужно описать

  • Конкретный pipeline: как промпт получает bounding boxes (model capability? отдельный step?)
  • UI/UX интерфейса review
  • Integration статус: deployed / в работе / прототип
  • Связь с RFC-012 OCR validation flow и fact-based recognition

Связано

Источники

Источники: 1 2 3.

Сноски

  1. Сессия ildar/c28bb497, 2026-04-09 — `** (Apr 9-10 2026.

  2. Сессия ildar/1d3c504b, 2026-04-21 — `** (Apr 21 2026) — rebase + ревью Никитиного code.

  3. Linear BG-1059, accessed 2026-05-17, https://linear.app/realai/issue/BG-1059Linear: BG-1059.