This commit is contained in:
2026-06-13 21:45:28 +02:00
parent 6bcb721eb4
commit f94573ea6e
473 changed files with 7805 additions and 31 deletions
+3 -1
View File
@@ -12,10 +12,12 @@ Skripty jsou v `/mnt/user/Scripts/` (volume → `/scripts/`).
**Pipeline** spouštěna 2× denně cronem (`0 6,18 * * *`) přes `run_pipeline.sh`:
- `1b` — Graph delta sync (nové/změněné emaily → MongoDB)
- `3` — Download attachments
- `3` — Download attachments (`3_download_attachments_v1.5.py`)
- `4` — Unwrap S/MIME
- `5` — Enrich fulltext → PostgreSQL
**Přílohy → SeaweedFS (2026-06-13):** krok 3 (v1.5) krom uložení na disk `/mnt/Emails/<mbox>/Attachments/` zároveň pushne každou novou přílohu do SeaweedFS přes sdílený `/scripts/seaweed_store.py`; do `emaily.attachments_index` (dedup SHA-256=_id) zapíše `seaweed_path/seaweed_url/seaweed_synced_at`. Výpadek SeaweedFS pipeline neshodí (jen warning, doplní backfill). Jednorázový backfill již stažených: `seaweed_attachments_backfill_graph.py` (batch+resume). Globální dedup s mailstore větví. Viz [[project-seaweedfs]].
**Wrapper:** `0_run_pipeline_v1.0.py`
- Na začátku auto-install: `pip install -q -r /scripts/requirements.txt` — odolné vůči recreate kontejneru
- Na konci email report: HTML tabulka výsledků z `reports@buzalka.cz``vladimir.buzalka@buzalka.cz`; při chybě přiloží log selhavšího kroku