diff --git a/Medevio/60 ScansProcessing/corrections.json b/Medevio/60 ScansProcessing/corrections.json index 07cf1ba..3ceaff0 100644 --- a/Medevio/60 ScansProcessing/corrections.json +++ b/Medevio/60 ScansProcessing/corrections.json @@ -1,4 +1,4 @@ -¨w[ +[ { "original": "505228025 2026-05-14 Titlbachová, Božena [Žádanka předoperační vyšetření GYNA] [Předop. vyšetření, dg. N890, malý výkon A, anestezie CA].pdf", "corrected": "505228025 2026-05-14 Titlbachová, Božena [žádanka předoperační vyšetření] [gynekologie, dg. N890, malý výkon A, anestezie CA].pdf" @@ -994,5 +994,73 @@ { "original": "7701120955 2026-05-04 Moudrý, Michal [RTG plic] [přiměřený nález na nitrohrudních orgánech, stac. od 12022].pdf", "corrected": "7701120955 2026-05-04 Moudrý, Michal [RTG plic] [přiměřený nález na nitrohrudních orgánech, stac. od JAN2022].pdf" + }, + { + "original": "495227264 2026-04-01 Hajšmanová, Marcela [TK deník] [duben–květen 2026, hodnoty 112–151/57–99 mmHg].pdf", + "corrected": "495227264 2026-04-01 Hajšmanová, Marcela [domácí měření TK] [duben–květen 2026, hodnoty 112–15157–99 mmHg, pěkná korekce TK].pdf" + }, + { + "original": "6561150607 2026-05-11 Tipplová, Michaela [LZ endokrinologie] [kontrola, sono ŠŽ hraničně normální nález, zlepšený nález, TSH 1.777, fT4 14.56].pdf", + "corrected": "6561150607 2026-05-11 Tipplová, Michaela [LZ endokrinologie] [kontrola, sono ŠŽ hraničně normální nález, zlepšený nález, TSH 1.777, fT4 14.56, bez medikace, další kontroly na endokrinologii nejsou nutné].pdf" + }, + { + "original": "7353120313 2026-05-07 Slámová, Lucie [LZ ORL] [KHCd, Rp: Klácid dále, Erdomed, Codein na noc].pdf", + "corrected": "7353120313 2026-05-07 Slámová, Lucie [LZ ORL] [KHCd, Rp Klacid dále, Erdomed, Codein na noc].pdf" + }, + { + "original": "7356055707 2025-10-30 Kašíková, Petra [kolonoskopie] [klidná jizva v distálním rektu, bez známek reziduální neoplasie, biopsie].pdf", + "corrected": "7356055707 2025-10-30 Kašíková, Petra [kolonoskopie] [stp odstranění ca v polypu rekta na proktologii, T1, klidná jizva v distálním rektu, bez známek reziduální neoplasie, biopsie].pdf" + }, + { + "original": "7356055707 2026-04-18 Kašíková, Petra [žádost k praktickému lékaři] [nižší hodnoty Hb 115 g/L i při feroterapii, žádost o vyšetření a léčbu].pdf", + "corrected": "7356055707 2026-04-18 Kašíková, Petra [žádost o lékařské vyšetření] [dárce plasmy, nižší hodnoty Hb 115 gL i při feroterapii, žádost o vyšetření a léčbu].pdf" + }, + { + "original": "7651090106 2026-03-26 Matějková, Jana [LZ gastroenterologie] [gastroskopie: mírné zánětlivé změny bulbu duodena, noracidita, dop. kolonoskopie, ev. CHE a APPE].pdf", + "corrected": "7651090106 2026-03-26 Matějková, Jana [LZ gastroenterologie] [gastroskopie mírné zánětlivé změny bulbu duodena, noracidita, dop. kolonoskopie, ev. CHE a APPE].pdf" + }, + { + "original": "7651090106 2026-03-27 Matějková, Jana [LZ neurochirurgie] [operace odložena, stenóza L4/5, motoricky zánikový sy L5 vlevo, iritační sy S1 bilat.].pdf", + "corrected": "7651090106 2026-03-27 Matějková, Jana [LZ neurochirurgie] [operace odložena - akutní infekce, stenóza L45, motoricky zánikový sy L5 vlevo, iritační sy S1 bilat.].pdf" + }, + { + "original": "7651090106 2026-02-10 Matějková, Jana [LZ neurochirurgie] [indikována dekomprese L45, nástup k hospitalizaci 13.4.26, syringomyelie].pdf", + "corrected": "7651090106 2026-02-10 Matějková, Jana [LZ neurochirurgie] [MRI 08FEB2026 progrese stenózy L45, indikována dekomprese L45, nástup k hospitalizaci 13.4.26, syringomyelie].pdf" + }, + { + "original": "7651090106 2026-05-11 Matějková, Jana [Laboratoř] [URO +1 (16 umol/L), PRO +/- (trace g/L), KET +2 (4 mmol/L)].pdf", + "corrected": "7651090106 2026-05-11 Matějková, Jana [Uritex] [URO +1 (16 umolL), PRO +- (trace gL), KET +2 (4 mmolL)].pdf" + }, + { + "original": "7810073579 2026-03-12 Taláb, Jan [LZ ORL] [polyposis nasi - min. residuum oboustranně, dop. Ryaltris 1x denně].pdf", + "corrected": "7810073579 2026-03-12 Taláb, Jan [LZ ORL] [kontrola, polyposis nasi - min. residuum oboustranně, dop. Ryaltris 1x denně].pdf" + }, + { + "original": "7958275116 2023-08-11 Chrastinová, Romana [EKG] [SR, Fr 69/min, osa normální, PQ normální, ST izol., neg T V1, ESB, voltáž v toleranci].pdf", + "corrected": "7958275116 2023-08-11 Chrastinová, Romana [EKG] [fyziologická křivka, SR, Fr 69min, osa normální, PQ normální, ST izol., neg T V1, ESB, voltáž v toleranci].pdf" + }, + { + "original": "7958275116 Chrastinová, Romana split_006.pdf", + "corrected": "7958275116 2026-05-11 Chrastinová, Romana [EKG] [bez hodnocení].pdf" + }, + { + "original": "9901040160 Tvrz, Matěj split_003.pdf", + "corrected": "9901040160 2026-05-11 Tvrz, Matěj [EKG] [bez hodnocení].pdf" + }, + { + "original": "7352200328 2026-05-07 Vališová, Gabriela [Dlouhodobý monitoring TK] [ABPM 06-07.05.2026, 33h51min, denní hodnoty zvýšené, noční pokles přítomen].pdf", + "corrected": "7352200328 2026-05-07 Vališová, Gabriela [Holter TK] [ABPM 06-07.05.2026, 33h51min, denní hraniční, noční OK].pdf" + }, + { + "original": "535418228 2026-02-12 Nováková, Leona [LZ hematologie] [izolovaná asympt. stacionární trombocytopenie od 3/23, aspirát KD 3/25 MDS neg, APLA hraniční bez TEN].pdf", + "corrected": "535418228 2026-02-12 Nováková, Leona [LZ hematologie] [izolovaná asympt. stacionární trombocytopenie od 323, aspirát KD 325 MDS neg, APLA hraniční bez TEN].pdf" + }, + { + "original": "495912016 2026-05-06 Kameníková, Marie [sono ŠŽ] [AIT atrofizace, v sledování, UZ nález bez změn od 5/2024].pdf", + "corrected": "495912016 2026-05-06 Kameníková, Marie [sono ŠŽ] [AIT atrofizace, v sledování, UZ nález bez změn od 52024].pdf" + }, + { + "original": "3568c410-090f-49d3-b898-8fef12f05397.pdf", + "corrected": "8459699809 2026-04-20 Bysmak, Mariia [sono žil DK] [žíly volně průchodné, varikózní dilatace VSM bilat se známkami chlopenní insuficience].pdf" } ] \ No newline at end of file diff --git a/Medevio/60 ScansProcessing/extract_patient_info_novy.py b/Medevio/60 ScansProcessing/extract_patient_info_novy.py index ea5a61b..41dbeaa 100644 --- a/Medevio/60 ScansProcessing/extract_patient_info_novy.py +++ b/Medevio/60 ScansProcessing/extract_patient_info_novy.py @@ -200,9 +200,22 @@ def check_duplicates(rc: str, datum: str) -> list[str]: # ─── Korekce (few-shot příklady) ───────────────────────────────────────────── def load_corrections() -> list[dict]: - if CORRECTIONS_FILE.exists(): - return json.loads(CORRECTIONS_FILE.read_text(encoding="utf-8")) - return [] + if not CORRECTIONS_FILE.exists(): + return [] + content = CORRECTIONS_FILE.read_text(encoding="utf-8") + idx = content.find('[') + if idx < 0: + return [] + try: + result = json.loads(content[idx:]) + # Pokud byl soubor poškozený (garbage před [), přepiš ho čistě + if idx > 0: + CORRECTIONS_FILE.write_text( + json.dumps(result, ensure_ascii=False, indent=2), encoding="utf-8" + ) + return result + except json.JSONDecodeError: + return [] def save_correction(original: str, corrected: str): if not CORRECTIONS: @@ -249,6 +262,8 @@ def extract_info(pdf_path: Path, known_patient: str | None = None, known_rc: str img.save(buf, format="JPEG", quality=95) img.close() else: + from PIL import Image as _PILImage + _PILImage.MAX_IMAGE_PIXELS = None # vypni limit pro naše vlastní PDFs images = convert_from_path(str(pdf_path), poppler_path=POPPLER_PATH, dpi=300) buf = io.BytesIO() images[0].save(buf, format="JPEG", quality=95)