Koszty pracy z narzędziami AI wymknęły się wielu zespołom z rąk. Nie dlatego, że modele są drogie — ale dlatego, że nikt nie nauczył programistów, jak z nich korzystać ekonomicznie. Wrzucasz cały plik do kontekstu. Prosisz Claude'a o parser CSV zamiast szukać gotowej biblioteki. Generujesz 50 tysięcy tokenów myślenia dla zadania, które Haiku załatwiłby w 200.
Ile naprawdę kosztuje praca z Claude Code?
Według oficjalnej dokumentacji Anthropic: średnio 6 dolarów na programistę dziennie. 90% użytkowników poniżej 12 USD/dzień. Miesięcznie z Sonnet 4.6: 100-200 USD/developer. Komenda /cost pokazuje bieżące zużycie. Sesje w tle: ok. 0,04 USD.
Zarządzanie kontekstem — klucz do rachunków
Rozmiar kontekstu = główny czynnik kosztowy. Zasady: /clear między zadaniami, prompt caching (automatyczny), auto-compaction (podsumowanie historii), precyzyjne prompty ("sprawdź auth.ts" zamiast "przejrzyj cały projekt" — różnica 10x).
Wybór modelu na zadanie
Sonnet 4.6 — koń roboczy, 90% zadań. Opus — tylko złożone decyzje architektoniczne. Haiku — subagenty, proste transformacje, ułamek ceny. Extended thinking — najdroższy czynnik, obniż przez /effort lub MAX_THINKING_TOKENS=8000. Plan mode (Shift+Tab) — 5 min planowania oszczędza godziny poprawek.
Automatyzacja skryptami Python
Nie wysyłaj do AI tego, co skrypt zrobi za darmo. Przetwarzanie logów: filtruj do 50 linii zamiast wklejać 10 000. Przygotowanie danych: pandas agreguje 200 plików JSON w sekundy. Batch processing: wywołuj API programowo z rate limitingiem. Preprocessing to nawyk: "Czy mogę to przefiltrować skryptem?"
GitHub — nie wymyślaj koła na nowo
Zanim poprosisz AI o parser Markdown, walidator emaili, generator PDF — sprawdź GitHub. marked, zod, puppeteer, bullmq, oficjalne SDK. Biblioteka z 1000+ gwiazdek > kod pisany od zera. CLI tools: gh zamiast MCP GitHub, aws cli zamiast MCP AWS. Frameworki: Express, Prisma, NextAuth — setki tysięcy godzin pracy społeczności.
Podpinaj API innych narzędzi
OpenRouter — dziesiątki modeli (Llama, Mistral, DeepSeek), 5-20x taniej dla prostych zadań. Ollama — lokalne modele, koszt zero. Specjalistyczne API: Tesseract (OCR, darmowy), DeepL (tłumaczenia), HuggingFace (sentyment), Whisper (transkrypcja). Hierarchia: (1) skrypt/biblioteka, (2) lokalny model, (3) tani API, (4) Sonnet, (5) Opus.
Hooki, skille i subagenty
Hooki preprocessują dane przed Claude. Skille ładują się on-demand (vs CLAUDE.md zawsze). MCP tools domyślnie odroczone. Subagenty delegują verbose zadania do izolowanego kontekstu. Code intelligence plugins redukują odczyty plików.
Filozofia: minimum tokenów, maksimum rezultatu
Większość rzeczy ktoś już napisał — szukaj na GitHubie. Skrypt kosztuje zero tokenów przy każdym uruchomieniu. Odpowiednie narzędzie do zadania. Planuj zanim zaczniesz kodować. Mierz: /cost, monitoring API.
Źródła: Anthropic — Manage costs effectively (code.claude.com/docs/en/costs). OpenRouter (openrouter.ai). Ollama (ollama.com).