35 lines
1.3 KiB
Markdown
35 lines
1.3 KiB
Markdown
# 2_refetch_text_bodies_v1.0.py
|
|
|
|
**Krok 2 pipeline** — ONETIME oprava starých plain-text emailů. Starý `parse_emails_graph_v1.3` ukládal plain-text emaily jen jako prvních 2000 znaků do `body_preview`; plné tělo se zahazovalo. Tento skript najde takové emaily a re-fetchne plný obsah do nového pole `body_text` (max 2 MB).
|
|
|
|
> Pro schránky importované rovnou v1.4 nemá co dělat (kandidátů 0). Drží se kvůli archivním schránkám importovaným ve v1.3.
|
|
|
|
## Argumenty
|
|
|
|
| Argument | Povinný | Hodnoty | Default | Popis |
|
|
|---|---|---|---|---|
|
|
| `--mailbox` | ne | e-mail | (všechny) | Jedna konkrétní schránka |
|
|
| `--limit N` | ne | int | (bez limitu) | Limit emailů na schránku (test) |
|
|
|
|
## Varianty volání
|
|
|
|
```bash
|
|
# Všechny schránky:
|
|
docker exec -it python-runner python /scripts/2_refetch_text_bodies_v1.0.py
|
|
|
|
# Jedna schránka:
|
|
docker exec -it python-runner python /scripts/2_refetch_text_bodies_v1.0.py --mailbox ordinace@buzalkova.cz
|
|
|
|
# Test 20 emailů:
|
|
docker exec -it python-runner python /scripts/2_refetch_text_bodies_v1.0.py --mailbox ordinace@buzalkova.cz --limit 20
|
|
|
|
# Plný běh na pozadí, log do souboru:
|
|
docker exec -d python-runner bash -c "python /scripts/2_refetch_text_bodies_v1.0.py > /scripts/refetch.log 2>&1"
|
|
```
|
|
|
|
## Sledování průběhu
|
|
|
|
```bash
|
|
docker exec -it python-runner tail -f /scripts/refetch.log
|
|
```
|