z230

2026-05-18 11:03:53 +02:00
parent 1f25bcbc14
commit 6498c4e444
4 changed files with 359 additions and 0 deletions
@@ -0,0 +1,69 @@
+# RozkladScanu — poznámky
+
+## Skript: `rozloz_brozuru.py`
+
+Univerzální skript pro oba druhy skenování níže. Vše se odvodí automaticky z PDF.
+
+```
+python rozloz_brozuru.py vstup/<soubor.pdf> vystup/<soubor_serazena.pdf>
+```
+
+Pokud není zadán výstup, pojmenuje se `<vstup>_serazena.pdf` ve stejném adresáři jako vstup.
+
+---
+
+## Druh skenování: KONICA_DUPLEX_OD_STREDU
+
+**Použití:** brožura (sešit) se sedlovým šitím, rozešitá a skenovaná oboustranně od prostřední stránky směrem ven na Konice.
+
+**Podmínky:**
+- Každý sken = dvojstránka A3 landscape (levá + pravá A4 vedle sebe)
+- Skenování začíná od středového listu a postupuje ven
+- Každý list: nejdřív přední strana, pak zadní
+
+**Příklad — brožura 24 stran (střed 12+13), 12 PDF stránek:**
+
+| PDF str. | Levá | Pravá |
+|----------|:----:|:-----:|
+| 1        | 12   | 13    |
+| 2        | 14   | 11    |
+| 3        | 10   | 15    |
+| ...      | ...  | ...   |
+| 12       | 24   | 1     |
+
+Výstup: 24 stránek A4, seřazeny 1–24.
+
+---
+
+## Druh skenování: RICOH_DUPLEX_OD_STREDU
+
+**Použití:** brožura (sešit) se sedlovým šitím, rozešitá a skenovaná oboustranně od prostřední stránky směrem ven na RICOHu.
+
+**Podmínky:**
+- Každý sken = A4 landscape (levá + pravá A5 vedle sebe)
+- Skenování začíná od středového listu a postupuje ven
+- Každý list: nejdřív přední strana, pak zadní
+
+**Příklad — brožura 80 stran (střed 40+41), 40 PDF stránek:**
+
+| PDF str. | Levá | Pravá |
+|----------|:----:|:-----:|
+| 1        | 40   | 41    |
+| 2        | 42   | 39    |
+| 3        | 38   | 43    |
+| ...      | ...  | ...   |
+| 40       | 80   | 1     |
+
+Výstup: 80 stránek A5, seřazeny 1–80.
+
+---
+
+## Algoritmus (společný pro oba druhy)
+
+Střed se odvodí automaticky: `CENTER_LEFT = počet PDF stránek`, `CENTER_RIGHT = počet PDF stránek + 1`.
+
+Pro list č. `k` (0-based od středu):
+- přední strana (PDF `2k+1`): levá = `CENTER_LEFT - 2k`, pravá = `CENTER_RIGHT + 2k`
+- zadní strana (PDF `2k+2`): levá = `CENTER_RIGHT + 2k + 1`, pravá = `CENTER_LEFT - 2k - 1`
+
+Každá PDF stránka se ořízne na levou a pravou polovinu (vždy stejný formát — poloviční šířka).
@@ -0,0 +1,9 @@
+# Jak skenovat brožuru
+
+## KONICA
+
+Rozlož brožuru středem nahoru a textem k sobě.
+
+## RICOH
+
+Rozlož brožuru a dej do skeneru tak, aby zadní strana byla střed brožury a dolní okraj textu na střední stránce aby byl vlevo.
@@ -0,0 +1,205 @@
+"""
+navrh_pojmenovani.py — Claude navrhne jmeno souboru pro naskenovanou brozuru.
+
+Vezme prvnich N stranek PDF, posle je Claudovi jako obrazky a navrhne nazev.
+Dialog umozni opravit navrh. Historie dvojic (navrh Claudea, volba uzivatele)
+se ulozi a priste prikladem uci Claudea pojmenovavat podle tvych preferencí.
+
+Pouziti:
+    python navrh_pojmenovani.py vystup/brozura.pdf
+    python navrh_pojmenovani.py vystup/brozura.pdf vystup/muj_nazev.pdf
+"""
+
+import sys
+import json
+import base64
+import io
+import copy
+import tkinter as tk
+from pathlib import Path
+from datetime import date
+import fitz          # pymupdf
+import anthropic
+
+HISTORY_FILE = Path(__file__).parent / "pojmenovani_historie.json"
+N_PAGES      = 5
+DPI          = 120   # dostatecne pro cteni obsahu, nizke naklady na tokeny
+
+
+# ---------- pomocne funkce ----------
+
+def load_history() -> list:
+    if HISTORY_FILE.exists():
+        return json.loads(HISTORY_FILE.read_text(encoding="utf-8"))
+    return []
+
+
+def save_history(history: list):
+    HISTORY_FILE.write_text(
+        json.dumps(history, ensure_ascii=False, indent=2),
+        encoding="utf-8",
+    )
+
+
+def pdf_pages_to_b64(pdf_path: str, n: int = N_PAGES) -> list[str]:
+    """Vrati seznam base64 JPEG retezcu pro prvnich n stranek PDF."""
+    doc = fitz.open(pdf_path)
+    pages = min(n, len(doc))
+    result = []
+    mat = fitz.Matrix(DPI / 72, DPI / 72)
+    for i in range(pages):
+        pix = doc[i].get_pixmap(matrix=mat, colorspace=fitz.csRGB)
+        jpeg = pix.tobytes("jpeg", jpg_quality=75)
+        result.append(base64.standard_b64encode(jpeg).decode())
+    doc.close()
+    return result
+
+
+def ask_claude(images_b64: list[str], history: list) -> str:
+    """Posle stranky Claudovi a vrati navrzeny nazev souboru."""
+    client = anthropic.Anthropic()
+
+    history_text = ""
+    if history:
+        history_text = "\n\nPriklady z minulosti (muj navrh → uzivatel zvolil):\n"
+        for item in history[-15:]:
+            history_text += f"  {item['claude']} -> {item['user']}\n"
+
+    content: list = []
+    for i, b64 in enumerate(images_b64):
+        content.append({
+            "type": "image",
+            "source": {"type": "base64", "media_type": "image/jpeg", "data": b64},
+        })
+
+    today = date.today().strftime("%Y-%m-%d")
+    content.append({
+        "type": "text",
+        "text": (
+            f"Toto je prvnich {len(images_b64)} stranek naskenované brozury. "
+            "Navrhni vhodny kratky nazev souboru (bez pripony). "
+            f"Zacni vzdy datem dnesniho dne ve formatu YYYY-MM-DD ({today}), "
+            "pak podtrzitko a popis obsahu. "
+            "Pouzij pouze ASCII znaky, cisla, podtrzitka nebo pomlcky — zadna diakritika ani mezery. "
+            "Popis ma vystihovat obsah dokumentu, byt strucny (2–4 slova)."
+            f"{history_text}\n\n"
+            "Odpovez pouze samotnym nazvem souboru, nic jineho. "
+            f"Priklad spravneho formatu: {today}_nazev_dokumentu"
+        ),
+    })
+
+    response = client.messages.create(
+        model="claude-opus-4-7",
+        max_tokens=64,
+        thinking={"type": "adaptive"},
+        messages=[{"role": "user", "content": content}],
+    )
+
+    for block in response.content:
+        if block.type == "text":
+            return block.text.strip().strip('"').strip("'")
+    return "brozura"
+
+
+def dialog(claude_suggestion: str) -> dict:
+    """Zobrazi dialog s navrzenim nazvem, uzivatel muze opravit."""
+    root = tk.Tk()
+    root.title("Navrh pojmenovani")
+    root.resizable(False, False)
+    root.attributes("-topmost", True)
+
+    result = {"name": None, "cancelled": False}
+
+    tk.Label(
+        root, text="Claude navrhuje:", font=("Segoe UI", 9, "italic"), fg="#555"
+    ).pack(padx=24, pady=(16, 2), anchor="w")
+
+    tk.Label(
+        root, text=claude_suggestion, font=("Segoe UI", 12, "bold"), fg="#1a6aaa"
+    ).pack(padx=24, anchor="w")
+
+    tk.Label(
+        root, text="Nazev souboru (uprav pokud chces):", font=("Segoe UI", 9)
+    ).pack(padx=24, pady=(12, 2), anchor="w")
+
+    entry = tk.Entry(root, width=52, font=("Segoe UI", 10))
+    entry.insert(0, claude_suggestion)
+    entry.pack(padx=24)
+    entry.select_range(0, tk.END)
+    entry.focus_set()
+
+    def ok(event=None):
+        val = entry.get().strip()
+        if val:
+            result["name"] = val
+        root.destroy()
+
+    def cancel(event=None):
+        result["cancelled"] = True
+        root.destroy()
+
+    btn = tk.Frame(root)
+    btn.pack(pady=16)
+    tk.Button(btn, text="OK", width=12, command=ok).pack(side=tk.LEFT, padx=6)
+    tk.Button(btn, text="Zrusit", width=12, command=cancel).pack(side=tk.LEFT, padx=6)
+
+    root.bind("<Return>", ok)
+    root.bind("<Escape>", cancel)
+    root.mainloop()
+    return result
+
+
+# ---------- hlavni logika ----------
+
+def main():
+    if len(sys.argv) < 2:
+        print(__doc__)
+        sys.exit(1)
+
+    pdf_path = Path(sys.argv[1])
+    if not pdf_path.exists():
+        print(f"Soubor nenalezen: {pdf_path}")
+        sys.exit(1)
+
+    # vystupni cesta — volitelny druhy argument
+    out_path: Path | None = None
+    if len(sys.argv) > 2:
+        out_path = Path(sys.argv[2])
+
+    print(f"Nacitam stranky z: {pdf_path}")
+    images = pdf_pages_to_b64(str(pdf_path), N_PAGES)
+    print(f"  {len(images)} stranek prevedeno na obrazky")
+
+    history = load_history()
+    print(f"  {len(history)} polozek v historii pojmenovani")
+
+    print("Ptam se Claudea...")
+    claude_name = ask_claude(images, history)
+    print(f"  Claude navrhuje: {claude_name}")
+
+    res = dialog(claude_name)
+
+    if res["cancelled"] or not res["name"]:
+        print("Zruseno — soubor nebyl prejmenovan.")
+        return
+
+    user_name = res["name"]
+
+    # uloz do historie
+    history.append({"claude": claude_name, "user": user_name})
+    save_history(history)
+    print(f"  Historie ulozena ({len(history)} polozek)")
+
+    # urceni vystupniho souboru
+    if out_path is None:
+        out_path = pdf_path.parent / (user_name + pdf_path.suffix)
+
+    if out_path != pdf_path:
+        pdf_path.rename(out_path)
+        print(f"Prejmenovan: {out_path}")
+    else:
+        print(f"Nazev beze zmeny: {out_path}")
+
+
+if __name__ == "__main__":
+    main()
@@ -0,0 +1,76 @@
+"""
+Rozlozi naskenovanou brozuru do PDF se strankami razenymi od 1.
+
+Predpoklady:
+  - Kazda PDF stranka obsahuje dve stranky brozury vedle sebe (leva + prava).
+  - Sken probíhal duplexne od stredoveho listu smerem ven.
+  - Stredove stranky se odvodi automaticky z poctu PDF stranek.
+
+Pouziti:
+  python rozloz_brozuru.py <vstup.pdf> [vystup.pdf]
+"""
+
+import sys
+import copy
+from pypdf import PdfReader, PdfWriter
+from pypdf.generic import RectangleObject
+
+
+def rozloz(input_path, output_path):
+    reader = PdfReader(input_path)
+    n_pdf = len(reader.pages)
+
+    center_left  = n_pdf           # napr. 12 nebo 40
+    center_right = n_pdf + 1       # napr. 13 nebo 41
+    total_pages  = n_pdf * 2       # celkovy pocet stran brozury
+
+    print(f"PDF stranek : {n_pdf}")
+    print(f"Stran brozury: {total_pages}  (stred: {center_left}+{center_right})")
+
+    # Mapovani: brozurova strana -> (pdf_idx 0-based, 'L'/'P')
+    page_map = {}
+    n_sheets = n_pdf // 2
+
+    for k in range(n_sheets):
+        front_pdf = 2 * k
+        back_pdf  = 2 * k + 1
+
+        page_map[center_left  - 2 * k]     = (front_pdf, 'L')
+        page_map[center_right + 2 * k]     = (front_pdf, 'P')
+        page_map[center_right + 2 * k + 1] = (back_pdf,  'L')
+        page_map[center_left  - 2 * k - 1] = (back_pdf,  'P')
+
+    writer = PdfWriter()
+
+    for bp in range(1, total_pages + 1):
+        pdf_idx, lr = page_map[bp]
+        src = reader.pages[pdf_idx]
+
+        width  = float(src.mediabox.width)
+        height = float(src.mediabox.height)
+        half_w = width / 2
+
+        new_page = copy.copy(src)
+        if lr == 'L':
+            box = RectangleObject([0,      0, half_w, height])
+        else:
+            box = RectangleObject([half_w, 0, width,  height])
+        new_page.mediabox = box
+        new_page.cropbox  = box
+
+        writer.add_page(new_page)
+
+    with open(output_path, "wb") as f:
+        writer.write(f)
+
+    print(f"Hotovo: {output_path}  ({total_pages} stranek)")
+
+
+if __name__ == "__main__":
+    if len(sys.argv) < 2:
+        print("Pouziti: python rozloz_brozuru.py <vstup.pdf> [vystup.pdf]")
+        sys.exit(1)
+
+    inp = sys.argv[1]
+    out = sys.argv[2] if len(sys.argv) > 2 else inp.replace(".pdf", "_serazena.pdf")
+    rozloz(inp, out)