Files
janssen/Feasibility/77242113UCO2001/TRASH/store_cda_batch_v1.0.md
T

1.3 KiB
Raw Blame History

store_cda_batch_v1.0.py

Verze: 1.0 · Datum: 2026-06-09

Dávkové uložení binárek CDA (PDF) do Mongo feasibility.investigatorscda.data_*. Zdroj = .msg soubory na Toweru (/mnt/user/JNJEMAILS), stažené přes SFTP (paramiko), příloha vytažena extract_msg.

Princip

  • MAPPING = explicitní seznam (investigator_id, msg_filename, attachment_filename, label) — žádné hádání za běhu (matchování přílohy v .msg přes normalizaci bez diakritiky).
  • CDA chodí od 3 asistentek: Wittenbergerová (LWittenb), Hrabalová (LHrabalo), Vojčová (LVojcova). Konkrétní soubor bývá jmenován v STATUS lékaře.

Co zapisuje

cda.data_base64, cda.data_sha256, cda.data_filename, cda.data_mime, cda.data_size, cda.data_stored_at, cda.data_source_msg; doplní cda.soubor.

Spuštění

python store_cda_batch_v1.0.py            # dry-run / náhled
python store_cda_batch_v1.0.py --apply    # zápis do Mongo

venv má paramiko + extract_msg + pymongo.

Historie

  • v1.0 — dávka 1 (6×): Hlavatý/Cliniq, Fedurco/ENDOMED, Tichý, Falc, Pešta, Jungwirthová. Dávka 2 (3×): Matouš/Axon-master, Mihálkanin/Gastro LM, Krížová/FN Motol. Aplikováno 09JUN2026. (Lukáč zvlášť přes store_cda_to_mongo.)