Files
janssen/Python-runner/2_refetch_text_bodies_v1.0.md
2026-06-05 21:21:30 +02:00

1.3 KiB

2_refetch_text_bodies_v1.0.py

Krok 2 pipeline — ONETIME oprava starých plain-text emailů. Starý parse_emails_graph_v1.3 ukládal plain-text emaily jen jako prvních 2000 znaků do body_preview; plné tělo se zahazovalo. Tento skript najde takové emaily a re-fetchne plný obsah do nového pole body_text (max 2 MB).

Pro schránky importované rovnou v1.4 nemá co dělat (kandidátů 0). Drží se kvůli archivním schránkám importovaným ve v1.3.

Argumenty

Argument Povinný Hodnoty Default Popis
--mailbox ne e-mail (všechny) Jedna konkrétní schránka
--limit N ne int (bez limitu) Limit emailů na schránku (test)

Varianty volání

# Všechny schránky:
docker exec -it python-runner python /scripts/2_refetch_text_bodies_v1.0.py

# Jedna schránka:
docker exec -it python-runner python /scripts/2_refetch_text_bodies_v1.0.py --mailbox ordinace@buzalkova.cz

# Test 20 emailů:
docker exec -it python-runner python /scripts/2_refetch_text_bodies_v1.0.py --mailbox ordinace@buzalkova.cz --limit 20

# Plný běh na pozadí, log do souboru:
docker exec -d python-runner bash -c "python /scripts/2_refetch_text_bodies_v1.0.py > /scripts/refetch.log 2>&1"

Sledování průběhu

docker exec -it python-runner tail -f /scripts/refetch.log