244 lines
9.6 KiB
Python
244 lines
9.6 KiB
Python
#!/usr/bin/env python3
|
||
# -*- coding: utf-8 -*-
|
||
"""
|
||
seed_tracking.py
|
||
================
|
||
Naplní MongoDB databázi `ordinace`, kolekci `registrovani_tracking`, výchozím
|
||
snímkem registrovaných pacientů a jejich OVĚŘENÝM stavem u VZP.
|
||
|
||
Logika "v zakoupeném souboru pacientů":
|
||
- "Registrovaný v Medicusu" je jen stav v software.
|
||
- Skutečnost ověřujeme u pojišťovny: kdo je k danému dni registrující praktik
|
||
(odbornost 001) daného pacienta.
|
||
* praktik = Buzalková (IČP 09305001) -> v pořádku, v zakoupeném souboru
|
||
* praktik = někdo jiný / žádný -> NEBYL V ZAKOUPENÉM SOUBORU PACIENTŮ
|
||
|
||
Kategorie (plné podkategorie):
|
||
OK_BUZALKOVA praktik 001 je Buzalková (IČP 09305001)
|
||
JINY_PRAKTIK praktik 001 je jiné ZZZ
|
||
BEZ_PRAKTIKA_VZP pacient má u VZP záznam (jiná odbornost), ale praktika 001 ne
|
||
BEZ_ZAZNAMU_VZP VZP nevrátila žádný záznam (typicky jiná pojišťovna / neplatné RČ)
|
||
|
||
Schéma dokumentu (1 dokument na pacienta, _id = rodné číslo):
|
||
{
|
||
"_id": "8202...", "rc": "...", "prijmeni": "...", "jmeno": "...",
|
||
"pojistovna": {"kod": "111", "zkratka": "VZP"},
|
||
"vychozi_datum": "2025-01-01",
|
||
"aktualni": { ...snímek... },
|
||
"historie": [ { ...snímek..., "zmena": "výchozí snímek" }, ... ],
|
||
"created_at": ..., "updated_at": ...
|
||
}
|
||
|
||
Snímek (aktualni i položka historie):
|
||
{ "k_datu", "kategorie", "kategorie_popis", "v_zakoupenem_souboru" (bool),
|
||
"flag", "praktik_nazev", "praktik_icz", "praktik_icp",
|
||
"datum_zahajeni", "datum_ukonceni" }
|
||
|
||
Spuštění:
|
||
python seed_tracking.py # seed k 2025-01-01
|
||
python seed_tracking.py 2026-05-02 # aplikuje další snímek (appendne změny do historie)
|
||
"""
|
||
|
||
import sys
|
||
from pathlib import Path
|
||
from datetime import datetime, date, timezone
|
||
|
||
PROJECT_ROOT = Path(__file__).resolve().parent.parent.parent
|
||
sys.path.insert(0, str(PROJECT_ROOT))
|
||
|
||
import pymongo
|
||
from Knihovny.mysql_db import connect_mysql
|
||
|
||
# ── KONFIGURACE ───────────────────────────────────────────────────────────────
|
||
MONGO_URI = "mongodb://192.168.1.76:27017"
|
||
MONGO_DB = "ordinace"
|
||
MONGO_COLL = "registrovani_tracking"
|
||
ICP_BUZALKOVA = "09305001"
|
||
|
||
KATEGORIE_POPIS = {
|
||
"OK_BUZALKOVA": "OK – praktik je Buzalková (IČP 09305001)",
|
||
"JINY_PRAKTIK": "Registrován u jiného praktika",
|
||
"BEZ_PRAKTIKA_VZP": "U VZP bez praktika (odb. 001)",
|
||
"BEZ_ZAZNAMU_VZP": "VZP nevrátila žádný záznam (jiná pojišťovna / neplatné RČ)",
|
||
}
|
||
FLAG_MIMO_SOUBOR = "NEBYL V ZAKOUPENÉM SOUBORU PACIENTŮ"
|
||
|
||
|
||
def klasifikuj(praktik_001: dict | None, ma_nejaky_zaznam: bool) -> dict:
|
||
"""Vrátí snímek stavu (bez k_datu) na základě 001 záznamu z VZP."""
|
||
if praktik_001 and praktik_001.get("ICP") == ICP_BUZALKOVA:
|
||
kat = "OK_BUZALKOVA"
|
||
elif praktik_001:
|
||
kat = "JINY_PRAKTIK"
|
||
elif ma_nejaky_zaznam:
|
||
kat = "BEZ_PRAKTIKA_VZP"
|
||
else:
|
||
kat = "BEZ_ZAZNAMU_VZP"
|
||
|
||
v_souboru = (kat == "OK_BUZALKOVA")
|
||
nazev = (praktik_001 or {}).get("nazev_zzz")
|
||
icz = (praktik_001 or {}).get("ICZ")
|
||
od = (praktik_001 or {}).get("datum_zahajeni")
|
||
|
||
# Čitelný důvod, proč pacient NENÍ v zakoupeném souboru (kdo + od kdy)
|
||
if kat == "JINY_PRAKTIK":
|
||
flag_duvod = f"jiný praktik: {nazev} (IČZ {icz}) od {od}"
|
||
elif kat == "BEZ_PRAKTIKA_VZP":
|
||
flag_duvod = "u VZP bez registrujícího praktika (odb. 001)"
|
||
elif kat == "BEZ_ZAZNAMU_VZP":
|
||
flag_duvod = "VZP nevrátila žádný záznam (jiná pojišťovna / neplatné RČ / zaniklé pojištění)"
|
||
else:
|
||
flag_duvod = ""
|
||
|
||
return {
|
||
"kategorie": kat,
|
||
"kategorie_popis": KATEGORIE_POPIS[kat],
|
||
"v_zakoupenem_souboru": v_souboru,
|
||
"flag": "" if v_souboru else FLAG_MIMO_SOUBOR,
|
||
"flag_duvod": flag_duvod,
|
||
# "kdo" a "od kdy" registrujícího praktika dle VZP
|
||
"praktik_nazev": nazev,
|
||
"praktik_icz": icz,
|
||
"praktik_icp": (praktik_001 or {}).get("ICP"),
|
||
"praktik_od": od,
|
||
"datum_zahajeni": od,
|
||
"datum_ukonceni": (praktik_001 or {}).get("datum_ukonceni"),
|
||
}
|
||
|
||
|
||
def nacti_snimek_z_mysql(mysql, k_datu: str) -> dict:
|
||
"""
|
||
Vrátí {rc: {prijmeni, jmeno, pojistovna{}, praktik_001 | None, ma_zaznam}}
|
||
pro populaci registrovaných dotázaných k danému datu.
|
||
"""
|
||
cur = mysql.cursor()
|
||
|
||
# Populace = všechna dotázaná RČ (raw) k tomuto datu
|
||
cur.execute("SELECT rc FROM vzp_registrace_raw WHERE k_datu = %s", (k_datu,))
|
||
populace = [r[0] for r in cur.fetchall()]
|
||
|
||
# Parsované záznamy lékařů k tomuto datu
|
||
cur.execute("""
|
||
SELECT rc, prijmeni, jmeno, kod_odbornosti, ICP, ICZ, nazev_zzz,
|
||
poj_kod, poj_zkratka, datum_zahajeni, datum_ukonceni
|
||
FROM vzp_registrace_lekari
|
||
WHERE k_datu = %s
|
||
""", (k_datu,))
|
||
|
||
data: dict[str, dict] = {rc: {"prijmeni": None, "jmeno": None,
|
||
"pojistovna": {"kod": None, "zkratka": None},
|
||
"praktik_001": None, "ma_zaznam": False}
|
||
for rc in populace}
|
||
|
||
for (rc, prijmeni, jmeno, odb, icp, icz, nazev_zzz,
|
||
poj_kod, poj_zkr, dat_zah, dat_uk) in cur.fetchall():
|
||
d = data.setdefault(rc, {"prijmeni": None, "jmeno": None,
|
||
"pojistovna": {"kod": None, "zkratka": None},
|
||
"praktik_001": None, "ma_zaznam": False})
|
||
d["ma_zaznam"] = True
|
||
if prijmeni and not d["prijmeni"]:
|
||
d["prijmeni"] = prijmeni
|
||
if jmeno and not d["jmeno"]:
|
||
d["jmeno"] = jmeno
|
||
# Pojišťovnu vezmi z jakéhokoli záznamu (preferuj 001 níže)
|
||
if poj_kod and not d["pojistovna"]["kod"]:
|
||
d["pojistovna"] = {"kod": poj_kod, "zkratka": poj_zkr}
|
||
if odb == "001":
|
||
d["praktik_001"] = {
|
||
"ICP": icp, "ICZ": icz, "nazev_zzz": nazev_zzz,
|
||
"poj_kod": poj_kod, "poj_zkratka": poj_zkr,
|
||
"datum_zahajeni": str(dat_zah) if dat_zah else None,
|
||
"datum_ukonceni": str(dat_uk) if dat_uk else None,
|
||
}
|
||
# Pojišťovna z 001 má přednost
|
||
if poj_kod:
|
||
d["pojistovna"] = {"kod": poj_kod, "zkratka": poj_zkr}
|
||
|
||
return data
|
||
|
||
|
||
def apply_snapshot(coll, mysql, k_datu: str) -> dict:
|
||
"""
|
||
Klasifikuje populaci k danému datu a upsertne do Mongo.
|
||
Při změně kategorie/praktika oproti `aktualni` appendne do `historie`.
|
||
Vrátí statistiku.
|
||
"""
|
||
data = nacti_snimek_z_mysql(mysql, k_datu)
|
||
now = datetime.now(timezone.utc)
|
||
stats = {"novych": 0, "zmen": 0, "beze_zmeny": 0, "kategorie": {}}
|
||
|
||
for rc, d in data.items():
|
||
snimek = klasifikuj(d["praktik_001"], d["ma_zaznam"])
|
||
snimek_s_datem = {"k_datu": k_datu, **snimek}
|
||
stats["kategorie"][snimek["kategorie"]] = stats["kategorie"].get(snimek["kategorie"], 0) + 1
|
||
|
||
existing = coll.find_one({"_id": rc})
|
||
if existing is None:
|
||
doc = {
|
||
"_id": rc, "rc": rc,
|
||
"prijmeni": d["prijmeni"], "jmeno": d["jmeno"],
|
||
"pojistovna": d["pojistovna"],
|
||
"vychozi_datum": k_datu,
|
||
"aktualni": snimek_s_datem,
|
||
"historie": [{**snimek_s_datem, "zmena": "výchozí snímek"}],
|
||
"created_at": now, "updated_at": now,
|
||
}
|
||
coll.insert_one(doc)
|
||
stats["novych"] += 1
|
||
else:
|
||
akt = existing.get("aktualni", {})
|
||
zmena = (akt.get("kategorie") != snimek["kategorie"]
|
||
or akt.get("praktik_icp") != snimek["praktik_icp"])
|
||
update = {"aktualni": snimek_s_datem, "updated_at": now}
|
||
if d["prijmeni"]:
|
||
update["prijmeni"] = d["prijmeni"]
|
||
if d["jmeno"]:
|
||
update["jmeno"] = d["jmeno"]
|
||
ops = {"$set": update}
|
||
if zmena:
|
||
popis = (f"{akt.get('kategorie')} → {snimek['kategorie']}")
|
||
ops["$push"] = {"historie": {**snimek_s_datem, "zmena": popis}}
|
||
stats["zmen"] += 1
|
||
else:
|
||
stats["beze_zmeny"] += 1
|
||
coll.update_one({"_id": rc}, ops)
|
||
|
||
return stats
|
||
|
||
|
||
def main():
|
||
k_datu = sys.argv[1] if len(sys.argv) > 1 else "2025-01-01"
|
||
|
||
mysql = connect_mysql()
|
||
client = pymongo.MongoClient(MONGO_URI, serverSelectionTimeoutMS=3000)
|
||
client.admin.command("ping")
|
||
coll = client[MONGO_DB][MONGO_COLL]
|
||
|
||
# Indexy pro běžné dotazy
|
||
coll.create_index("aktualni.kategorie")
|
||
coll.create_index("aktualni.v_zakoupenem_souboru")
|
||
coll.create_index("prijmeni")
|
||
|
||
print(f"Aplikuji snímek k {k_datu} do {MONGO_DB}.{MONGO_COLL} ...")
|
||
stats = apply_snapshot(coll, mysql, k_datu)
|
||
|
||
print(f"\nNových pacientů : {stats['novych']}")
|
||
print(f"Změn stavu : {stats['zmen']}")
|
||
print(f"Beze změny : {stats['beze_zmeny']}")
|
||
print("\nRozpad podle kategorií:")
|
||
for kat, n in sorted(stats["kategorie"].items(), key=lambda x: -x[1]):
|
||
print(f" {kat:18s} {n:5d} {KATEGORIE_POPIS[kat]}")
|
||
|
||
celkem = sum(stats["kategorie"].values())
|
||
mimo = celkem - stats["kategorie"].get("OK_BUZALKOVA", 0)
|
||
print(f"\nCelkem v populaci: {celkem}")
|
||
print(f" v zakoupeném souboru (Buzalková): {stats['kategorie'].get('OK_BUZALKOVA', 0)}")
|
||
print(f" NEBYL v zakoupeném souboru : {mimo}")
|
||
|
||
mysql.close()
|
||
client.close()
|
||
|
||
|
||
if __name__ == "__main__":
|
||
main()
|