This commit is contained in:
2026-05-12 08:49:36 +02:00
parent 67ec430fd4
commit b693987a5c
2 changed files with 87 additions and 4 deletions
+69 -1
View File
@@ -1,4 +1,4 @@
¨w[ [
{ {
"original": "505228025 2026-05-14 Titlbachová, Božena [Žádanka předoperační vyšetření GYNA] [Předop. vyšetření, dg. N890, malý výkon A, anestezie CA].pdf", "original": "505228025 2026-05-14 Titlbachová, Božena [Žádanka předoperační vyšetření GYNA] [Předop. vyšetření, dg. N890, malý výkon A, anestezie CA].pdf",
"corrected": "505228025 2026-05-14 Titlbachová, Božena [žádanka předoperační vyšetření] [gynekologie, dg. N890, malý výkon A, anestezie CA].pdf" "corrected": "505228025 2026-05-14 Titlbachová, Božena [žádanka předoperační vyšetření] [gynekologie, dg. N890, malý výkon A, anestezie CA].pdf"
@@ -994,5 +994,73 @@
{ {
"original": "7701120955 2026-05-04 Moudrý, Michal [RTG plic] [přiměřený nález na nitrohrudních orgánech, stac. od 12022].pdf", "original": "7701120955 2026-05-04 Moudrý, Michal [RTG plic] [přiměřený nález na nitrohrudních orgánech, stac. od 12022].pdf",
"corrected": "7701120955 2026-05-04 Moudrý, Michal [RTG plic] [přiměřený nález na nitrohrudních orgánech, stac. od JAN2022].pdf" "corrected": "7701120955 2026-05-04 Moudrý, Michal [RTG plic] [přiměřený nález na nitrohrudních orgánech, stac. od JAN2022].pdf"
},
{
"original": "495227264 2026-04-01 Hajšmanová, Marcela [TK deník] [dubenkvěten 2026, hodnoty 112151/5799 mmHg].pdf",
"corrected": "495227264 2026-04-01 Hajšmanová, Marcela [domácí měření TK] [dubenkvěten 2026, hodnoty 1121515799 mmHg, pěkná korekce TK].pdf"
},
{
"original": "6561150607 2026-05-11 Tipplová, Michaela [LZ endokrinologie] [kontrola, sono ŠŽ hraničně normální nález, zlepšený nález, TSH 1.777, fT4 14.56].pdf",
"corrected": "6561150607 2026-05-11 Tipplová, Michaela [LZ endokrinologie] [kontrola, sono ŠŽ hraničně normální nález, zlepšený nález, TSH 1.777, fT4 14.56, bez medikace, další kontroly na endokrinologii nejsou nutné].pdf"
},
{
"original": "7353120313 2026-05-07 Slámová, Lucie [LZ ORL] [KHCd, Rp: Klácid dále, Erdomed, Codein na noc].pdf",
"corrected": "7353120313 2026-05-07 Slámová, Lucie [LZ ORL] [KHCd, Rp Klacid dále, Erdomed, Codein na noc].pdf"
},
{
"original": "7356055707 2025-10-30 Kašíková, Petra [kolonoskopie] [klidná jizva v distálním rektu, bez známek reziduální neoplasie, biopsie].pdf",
"corrected": "7356055707 2025-10-30 Kašíková, Petra [kolonoskopie] [stp odstranění ca v polypu rekta na proktologii, T1, klidná jizva v distálním rektu, bez známek reziduální neoplasie, biopsie].pdf"
},
{
"original": "7356055707 2026-04-18 Kašíková, Petra [žádost k praktickému lékaři] [nižší hodnoty Hb 115 g/L i při feroterapii, žádost o vyšetření a léčbu].pdf",
"corrected": "7356055707 2026-04-18 Kašíková, Petra [žádost o lékařské vyšetření] [dárce plasmy, nižší hodnoty Hb 115 gL i při feroterapii, žádost o vyšetření a léčbu].pdf"
},
{
"original": "7651090106 2026-03-26 Matějková, Jana [LZ gastroenterologie] [gastroskopie: mírné zánětlivé změny bulbu duodena, noracidita, dop. kolonoskopie, ev. CHE a APPE].pdf",
"corrected": "7651090106 2026-03-26 Matějková, Jana [LZ gastroenterologie] [gastroskopie mírné zánětlivé změny bulbu duodena, noracidita, dop. kolonoskopie, ev. CHE a APPE].pdf"
},
{
"original": "7651090106 2026-03-27 Matějková, Jana [LZ neurochirurgie] [operace odložena, stenóza L4/5, motoricky zánikový sy L5 vlevo, iritační sy S1 bilat.].pdf",
"corrected": "7651090106 2026-03-27 Matějková, Jana [LZ neurochirurgie] [operace odložena - akutní infekce, stenóza L45, motoricky zánikový sy L5 vlevo, iritační sy S1 bilat.].pdf"
},
{
"original": "7651090106 2026-02-10 Matějková, Jana [LZ neurochirurgie] [indikována dekomprese L45, nástup k hospitalizaci 13.4.26, syringomyelie].pdf",
"corrected": "7651090106 2026-02-10 Matějková, Jana [LZ neurochirurgie] [MRI 08FEB2026 progrese stenózy L45, indikována dekomprese L45, nástup k hospitalizaci 13.4.26, syringomyelie].pdf"
},
{
"original": "7651090106 2026-05-11 Matějková, Jana [Laboratoř] [URO +1 (16 umol/L), PRO +/- (trace g/L), KET +2 (4 mmol/L)].pdf",
"corrected": "7651090106 2026-05-11 Matějková, Jana [Uritex] [URO +1 (16 umolL), PRO +- (trace gL), KET +2 (4 mmolL)].pdf"
},
{
"original": "7810073579 2026-03-12 Taláb, Jan [LZ ORL] [polyposis nasi - min. residuum oboustranně, dop. Ryaltris 1x denně].pdf",
"corrected": "7810073579 2026-03-12 Taláb, Jan [LZ ORL] [kontrola, polyposis nasi - min. residuum oboustranně, dop. Ryaltris 1x denně].pdf"
},
{
"original": "7958275116 2023-08-11 Chrastinová, Romana [EKG] [SR, Fr 69/min, osa normální, PQ normální, ST izol., neg T V1, ESB, voltáž v toleranci].pdf",
"corrected": "7958275116 2023-08-11 Chrastinová, Romana [EKG] [fyziologická křivka, SR, Fr 69min, osa normální, PQ normální, ST izol., neg T V1, ESB, voltáž v toleranci].pdf"
},
{
"original": "7958275116 Chrastinová, Romana split_006.pdf",
"corrected": "7958275116 2026-05-11 Chrastinová, Romana [EKG] [bez hodnocení].pdf"
},
{
"original": "9901040160 Tvrz, Matěj split_003.pdf",
"corrected": "9901040160 2026-05-11 Tvrz, Matěj [EKG] [bez hodnocení].pdf"
},
{
"original": "7352200328 2026-05-07 Vališová, Gabriela [Dlouhodobý monitoring TK] [ABPM 06-07.05.2026, 33h51min, denní hodnoty zvýšené, noční pokles přítomen].pdf",
"corrected": "7352200328 2026-05-07 Vališová, Gabriela [Holter TK] [ABPM 06-07.05.2026, 33h51min, denní hraniční, noční OK].pdf"
},
{
"original": "535418228 2026-02-12 Nováková, Leona [LZ hematologie] [izolovaná asympt. stacionární trombocytopenie od 3/23, aspirát KD 3/25 MDS neg, APLA hraniční bez TEN].pdf",
"corrected": "535418228 2026-02-12 Nováková, Leona [LZ hematologie] [izolovaná asympt. stacionární trombocytopenie od 323, aspirát KD 325 MDS neg, APLA hraniční bez TEN].pdf"
},
{
"original": "495912016 2026-05-06 Kameníková, Marie [sono ŠŽ] [AIT atrofizace, v sledování, UZ nález bez změn od 5/2024].pdf",
"corrected": "495912016 2026-05-06 Kameníková, Marie [sono ŠŽ] [AIT atrofizace, v sledování, UZ nález bez změn od 52024].pdf"
},
{
"original": "3568c410-090f-49d3-b898-8fef12f05397.pdf",
"corrected": "8459699809 2026-04-20 Bysmak, Mariia [sono žil DK] [žíly volně průchodné, varikózní dilatace VSM bilat se známkami chlopenní insuficience].pdf"
} }
] ]
@@ -200,9 +200,22 @@ def check_duplicates(rc: str, datum: str) -> list[str]:
# ─── Korekce (few-shot příklady) ───────────────────────────────────────────── # ─── Korekce (few-shot příklady) ─────────────────────────────────────────────
def load_corrections() -> list[dict]: def load_corrections() -> list[dict]:
if CORRECTIONS_FILE.exists(): if not CORRECTIONS_FILE.exists():
return json.loads(CORRECTIONS_FILE.read_text(encoding="utf-8")) return []
return [] content = CORRECTIONS_FILE.read_text(encoding="utf-8")
idx = content.find('[')
if idx < 0:
return []
try:
result = json.loads(content[idx:])
# Pokud byl soubor poškozený (garbage před [), přepiš ho čistě
if idx > 0:
CORRECTIONS_FILE.write_text(
json.dumps(result, ensure_ascii=False, indent=2), encoding="utf-8"
)
return result
except json.JSONDecodeError:
return []
def save_correction(original: str, corrected: str): def save_correction(original: str, corrected: str):
if not CORRECTIONS: if not CORRECTIONS:
@@ -249,6 +262,8 @@ def extract_info(pdf_path: Path, known_patient: str | None = None, known_rc: str
img.save(buf, format="JPEG", quality=95) img.save(buf, format="JPEG", quality=95)
img.close() img.close()
else: else:
from PIL import Image as _PILImage
_PILImage.MAX_IMAGE_PIXELS = None # vypni limit pro naše vlastní PDFs
images = convert_from_path(str(pdf_path), poppler_path=POPPLER_PATH, dpi=300) images = convert_from_path(str(pdf_path), poppler_path=POPPLER_PATH, dpi=300)
buf = io.BytesIO() buf = io.BytesIO()
images[0].save(buf, format="JPEG", quality=95) images[0].save(buf, format="JPEG", quality=95)