maboto

10 commits 1 branch 1 tag 2.7 MiB

Author	SHA1	Message	Date
Jeuner	2029eb9fcf	Kategorisierung parallelisieren (bis zu 8 Batches gleichzeitig) Die 77 LLM-Calls liefen bisher sequenziell -> bei langsamer Modell-Latenz minutenlang. Jetzt ThreadPoolExecutor (parallel=8); id-basiertes Mapping ist reihenfolge-unabhängig, Logik unverändert. Voller deepseek-Lauf: 162s statt sequenziell ~20min bei der heutigen Latenz (~16s/Call). Schnelle Modelle (gemini-flash) entsprechend ~15-20s. +1 Test (parallel ordnet alle Batches vollständig zu). 58 Tests grün. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 18:15:14 +02:00
Jeuner	aa60331f7f	Fix: UI wählt empfohlenes deepseek-Default vor statt gedrosseltem Free-Modell Ursache des 429-'es hängt': Die UI wählte beim Laden das erste Top-Free-Modell vor; OpenRouter-Free-Modelle sind hart gedrosselt -> Lauf lief in 5x Retry + Abbruch. Jetzt: - /api/modelle stellt den Default (deepseek-v4-flash) als 'empfohlen' voran. - UI wählt das empfohlene Modell vor, markiert Free als 'oft gedrosselt' und stellt ein gemerktes Free-Modell NICHT automatisch wieder her. - Server-seitiges Fortschritts-Logging ([Stufe 2] Batch X/Y) fürs Live-Log. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 17:59:03 +02:00
Jeuner	62f5af533e	README: Ollama-Anbieter, deepseek-Default, Modell-Sichtbarkeit, Persistenz LLM-Konfig-Sektion um Anbieter-Umschalter (OpenRouter/Ollama) erweitert, ehrlicher Ollama-Modell-Hinweis, gemerkte Auswahl + sichtbares Modell. Test-Zahl auf 57 (inkl. E2E-Persistenz) aktualisiert. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 17:50:58 +02:00
Jeuner	2ffb89a6d2	Ollama-Konfig: Persistenz (localStorage) + E2E-Test, ehrliche Modell-Grenze Goal 'Ollama-Konfig bleibt bestehen & klappt', mit Tests: - Persistenz-Fix: Anbieter + Modell in localStorage gemerkt, init() stellt sie wieder her (URL-Param > gemerkt > Default). Behebt das Zurückspringen auf OpenRouter nach Reload. - E2E-Test (Playwright): Anbieter überlebt echten Reload. content-JSON-Fallback mit 3 Tests abgesichert. 57 Tests grün. - Ehrlich dokumentiert (Code-Untersuchung + UI-Hinweis): kleine lokale Modelle (qwen2.5-coder, gemma4, qwen3.5, llama3.2) liefern kein brauchbares Batch- Tool-Calling -> Ergebnis 'Sonstiges/unsicher' (markiert, nicht geraten). Brauchbare lokale Kategorisierung braucht ein starkes tool-Modell; Cloud (deepseek) bleibt die verlässliche Wahl. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 17:34:34 +02:00
Jeuner	2e80f0d826	Ollama als lokaler Anbieter + gewähltes LLM dauerhaft sichtbar - OllamaKategorisierer (lokaler OpenAI-kompatibler Endpoint, kein Key/Netz), baue_kategorisierer('ollama'), Default-Ollama-Modell. - modelle.lade_ollama_modelle: /api/tags + /api/show (Tool-Fähigkeit), nur tool-fähige taugen; leere Liste wenn Ollama aus. - web: /api/ollama-modelle, Anbieter im Kategorisier-Flow + Cache-Key, Modell+Anbieter im Ergebnis (als_struktur). - UI: Anbieter-Umschalter (OpenRouter/Ollama), gewähltes Modell als Chip im Konfig-Kopf (auch zugeklappt) + 'kategorisiert mit … (anbieter)' im Ergebnis, bookmarkbarer ?modell/?anbieter/?auto-Start. - content-JSON-Fallback fürs Tool-Parsing (manche lokale Modelle liefern die Antwort als Text-JSON). +6 Tests (53 gesamt). Ehrlich: lokal installierte Modelle (qwen2.5-coder/gemma4/qwen3.5) liefern kein brauchbares Tool-Calling -> Ergebnis dort 'Sonstiges/unsicher' (ehrlich markiert, nicht geraten). Cloud-Default deepseek-v4-flash voll verifiziert (1903 Angebote, modellstabil). Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 14:54:32 +02:00
Jeuner	59d7d916ef	Default-OpenRouter-Modell: deepseek-v4-flash (günstig + verlässlich) Verifiziert gegen Alternativen: sauberes Tool-Calling, über mehrere Batches konsistent, ~1,8 Cent pro vollem Lauf (5x günstiger als gemini-flash-lite). glm-4.7-flash/seed-1.6-flash riefen das Tool nicht sauber auf, free-Modelle sind hart gedrosselt. Per --modell / Web-UI weiter frei wählbar. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 14:13:51 +02:00
Jeuner	1ded067928	README: Web-UI + zweistufiger Flow dokumentiert, mit Screenshots - Neue Web-UI-Sektion: Stufe 1 (Rohdaten holen+speichern), separate OpenRouter-Konfig, Stufe 2 (Kategorisieren, gesperrt bis Rohdaten da). - Zwei Screenshots unter docs/ (Stufen-Ansicht + gruppiertes Ergebnis). - Nutzung um OpenRouter/--anbieter/--modelle ergänzt, Struktur und Test- zahl (47) nachgezogen, localhost-Hinweis. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 14:08:31 +02:00
Jeuner	11f1444599	Web-UI: zweistufiger Flow (Rohdaten holen+speichern / Kategorisieren) - Stufe 1 (/api/rohdaten): deterministischer Fetch + Persistenz pro PLZ/Woche in data/roh/, ohne LLM/Key. speicher.py serialisiert belegte Angebote verlustfrei (fehlende Felder bleiben null). - OpenRouter-Konfig als separates Panel (gilt für Stufe 2). - Stufe 2 (/api/kategorisieren): LLM-Schritt auf den GESPEICHERTEN Rohdaten, gesperrt solange keine vorliegen (400). Fetcht nicht erneut. - Funktionales Premium-Redesign: zwei nummerierte Stufen-Karten mit Status- Flags, erzwungene Reihenfolge, belegte Rohliste, ehrlicher Footer. - 47 Tests (+11: speicher Round-Trip, Endpoint-Sperre, Rohdaten offline). Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 09:44:14 +02:00
Jeuner	d6d9b07a99	Version 0.1.0 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 09:34:46 +02:00
Jeuner	39b8a98bc2	Initiale Implementierung: Angebots-Übersicht (Fetch + Kategorisierung + Web-UI) Der Schnitt aus CLAUDE.md ist durchgehalten: - Fetch (deterministisch, kein LLM): marktguru-Adapter mit geprüftem Ortsbezug (zipCode), Wochen-Cache, robots.txt-Respekt, ehrlicher Regel-4- Abbruch bei fehlendem Beleg statt Krücke. - Kategorisierung (einziger LLM-Ort): geschlossene Liste + Daten-Integrität als Code erzwungen; austauschbar via Protokoll (OpenRouter/Anthropic), mit Drosselung/Retry und ehrlichem Abbruch. - FastAPI-Web-UI als dünne Schicht: Modellauswahl (Liste/Suche/Refresh), Live-Fortschritt, gruppierte Ergebnisse mit Filtern, Ergebnis-Cache. - 36 Tests gegen die Architektur-Regeln (kein Auffüllen, Abbruch, Integrität, geschlossene Liste, Unsicherheit, Schnitt) und die Web-Schicht. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 09:29:59 +02:00