This commit is contained in:
2026-04-18 19:38:51 +02:00
parent 6d55fdc373
commit 9d5e20676b
6 changed files with 597 additions and 0 deletions
+46
View File
@@ -0,0 +1,46 @@
# 60 ScansProcessing
Agent pro zpracování naskenovaných lékařských zpráv (PDF i JPG/PNG).
## Skripty
### `extract_patient_info.py` — hlavní agent
Spuštění: `python extract_patient_info.py` (bez argumentů = celá složka ToProcess)
**Workflow:**
1. Načte soubory z `ToProcess/`
2. Claude Vision API (sonnet-4-6) extrahuje: jméno, RČ, datum, typ dokumentu, poznámku, navržený název, rotaci
3. Ověří pacienta v Medicus Firebird (tabulka KAR, pole RODCIS/PRIJMENI/JMENO)
4. Fuzzy matching RČ při nenalezení: vynechání cifry + záměna podobných (0↔8, 1↔7, 5↔6, 3↔8) + checksum /11
5. Upozorní na duplicitu v `U:\Dropbox\Ordinace\Dokumentace_zpracovaná\`
6. Interaktivní schválení / oprava názvu
7. JPG/PNG → skutečné PDF (správná orientace, DPI=150, quality=80)
8. Přesun do `Processed/`, smazání z `ToProcess/`
9. Opravy názvů se ukládají do `corrections.json` jako few-shot příklady
**Formát názvu souboru:**
`{RČ} {YYYY-MM-DD} {Příjmení}, {Jméno} [{typ dokumentu}] [{poznámka}].pdf`
Příklady typů: `LZ chirurgie`, `LZ kardiologie`, `Laboratoř`, `CT břicha`, `kolonoskopie`, `poukaz FT`
### `jpg_to_pdf.py` — konverze obrázku na PDF
```
python jpg_to_pdf.py soubor.jpg [vystup.pdf] [rotace_ccw]
```
- Opravuje EXIF orientaci
- Rotace: 0 / 90 / 180 / 270 (CCW)
- A4, DPI=150, quality=80, bez okrajů
- Používá se i interně z `extract_patient_info.py`
## Složky
| Složka | Účel |
|---|---|
| `ToProcess/` | Sem se házejí nové skeny (PDF, JPG, PNG) |
| `Processed/` | Správně pojmenované PDF po schválení |
| `U:\Dropbox\Ordinace\Dokumentace_zpracovaná\` | Finální archiv |
## Konfigurace
- API klíč: `U:\Medevio\.env``ANTHROPIC_API_KEY`
- Medicus: `localhost:c:\medicus 3\data\medicus.fdb` (Firebird, SYSDBA)
- Few-shot korekce: `corrections.json`