1.0 KiB
1.0 KiB
EmailAgent — TODO
Plánované
- OCR nad skeny — faktury bez textové vrstvy (skenovaná PDF) dnes
pdf_faktur_check()vracíbez_textua soubor se uloží jen s varováním[PDF BEZ TEXTU], bez ověření obsahu. Doplnit OCR (např. Tesseract /ocrmypdf, nebo render stránky přesfitz→ OCR), aby se i u skenů ověřilo slovofaktur*a případně vytěžil text pro klasifikaci.
Hotovo
- Cílová složka přepnuta na ostrou
#040 Faktury přijaté. - Po zpracování: kategorie
ClaudeProcessed+ přesun doInbox/ProcessedByAgent/Invoices(vyžaduje Mail.ReadWrite).
Možná rozšíření (až se výsledky odladí)
- Plánované spouštění přes Windows Task Scheduler.
- Přísnější režim: ukládat jen když text PDF potvrdí
faktur(tvrdá brána) — možné až po doplnění OCR, jinak hrozí ztráta skenovaných faktur. - Zvážit dedup i proti podsložce
NamedInvoicesbyOpenAIv cílové složce (dnes se hashuje jen top-level*.pdf).