Claude Sonnet 4.6 dołącza do stajni Anthropic. Opinia po pierwszym użyciu

Claude Sonnet 4.6 to najnowszy model Anthropic, ogłoszony 17 lutego 2026 roku. Od dziś jest domyślnym modelem na claude.ai dla planów Free i Pro, a dla API cena pozostaje taka sama jak Sonnet 4.5 – 3 USD / 15 USD za milion tokenów. Anthropic określa go jako „pełne ulepszenie”. Nie patch, nie kosmetyczne poprawki, ale upgrade każdej kluczowej kompetencji: kodowania, computer use, rozumowania na długim kontekście i planowania agentycznego.

Treść stworzona przy asyście AI

Pierwsze wrażenia z używania Claude Sonnet 4.6

W moich wrażeniach z używania Claude Opus 4.6, który swoją premierę miał przed dwoma tygodniami, pisałem o olbrzymiej tokenożerności nowego flagowego modelu Anthropic. Claude Sonnet 4.6 stanowić ma niejako odpowiedź na ten problem i o ile oczywiście nie dorównuje w głębi odpowiedzi swojemu starszemu bratu, tak tokenów faktycznie zużywa znacznie mniej. Przekonałem się o tym nieco przez przypadek.

Siadając do niniejszej publikacji, odpaliłem analizę przy pomocy użytkowanego przeze mnie dość intensywnie skilla Claude.md od Mike’a Friedmana z bloga The SEO Pub. Właściwie to nawet nie zauważyłem, że ustawiony domyślnie Opus 4.6 w trybie Extended wraz z premierą nowego Sonneta przeskoczył automatycznie właśnie na mniej tokenożerny model. W międzyczasie odpaliłem sobie w tle jeszcze trzy analizy różnych rzeczy plus jedną burzę mózgu i dopiero efekt uświadomił mnie, z czego właściwie korzystam.

Nie żebym był niezadowolony z samego outputu. Po prostu zdziwił mnie fakt, że jest znacznie bardziej kompaktowy i stanowi klasyczną odpowiedź chatbota. Nie stworzyły się automatycznie szczegółowe podsumowania w plikach .md, do których jestem już totalnie przyzwyczajony. Ponadto przeniesienie wygenerowanego na podstawie analizy tekstu (treść w dalszej części artykułu) do .html wymagało nie tylko dodatkowego polecenia, ale również późniejszej poprawki, usuwającej nadmiarowe CSS-y oraz niepotrzebne znaczniki. Opusik nigdy by mi czegoś takiego nie zrobił :/

Trzeba jednak przyznać, że ma to przełożenie na oszczędność tokenów, gdy używa się Sonnet 4.6. Wszystkie powyższe analizy, generowanie treści oraz dodatkowa rozkmina z boku zjadły zaledwie 20% z sesyjnego limitu dla planu Pro. Dla porównania puściłem typowe zapytanie do wspomnianego już skilla w Opus 4.6. Po przetworzeniu miałem wprawdzie cudowny plik .md z bardzo szczegółową i cenną analizą, ale wykorzystanie tokenów z obecnej sesji błyskawicznie podskoczyło do 43%. I to przy zaledwie jednym odpaleniu, więc różnica zgodnie z przewidywaniami jest kolosalna.

Jako że w kilka godzin po premierze trudno powiedzieć coś mądrzejszego, dalej oddaję już głos samej sztucznej inteligencji.

Dalsza część artykułu to przygotowane przez AI podsumowanie materiałów udostępnionych z okazji premiery Claude Sonnet 4.6 przez Anthropic. Do jego przygotowania posłużył właśnie model wypuszczony 17 lutego 2026 roku.

Co nowego w Claude Sonnet 4.6 wobec Sonnet 4.5?

Największe zmiany dotyczą czterech obszarów:

kodowania,
computer use,
rozumowania na długim kontekście,
spójności działania w wieloetapowych zadaniach.

W Claude Code użytkownicy z wczesnego dostępu mieli wybierać Sonnet 4.6 nad Sonnet 4.5 w 70% przypadków. Co ważniejsze, preferowali go też bardziej niż Claude Opus 4.5 (flagowy model z listopada 2025), wybierając w 59% przypadków. Deweloperzy zgłaszali, że model lepiej czyta kontekst przed modyfikacją kodu, porządkuje współdzieloną logikę zamiast ją powielać, rzadziej halucynuje i lepiej wywiązuje się z wieloetapowych zadań.

Computer use – od eksperymentu do przydatnego narzędzia

W październiku 2024 Anthropic było pierwszą firmą, która wypuściła model zdolny do ogólnego computer use – obsługi komputera tak, jak robi to człowiek: klikając myszką i wpisując tekst, bez żadnych specjalnych API ani dedykowanych connectorów. Sami przyznali wtedy, że to wciąż eksperyment, „niezgrabny i podatny na błędy.”

Minęło szesnaście miesięcy. Benchmark OSWorld – standardowy test computer use obejmujący setki zadań w prawdziwym oprogramowaniu (Chrome, LibreOffice, VS Code) na symulowanym komputerze – pokazuje jak daleką drogę przeszły modele Sonnet. Wczesni użytkownicy Sonnet 4.6 raportują zdolności na ludzkim poziomie przy nawigacji po złożonych arkuszach kalkulacyjnych czy wypełnianiu wieloetapowych formularzy.

Uwaga na prompt injection. Computer use niesie ze sobą ryzyko: złośliwe instrukcje ukryte na stronach mogą próbować przejąć kontrolę nad modelem. Anthropic informuje, że Sonnet 4.6 jest znacznie odporniejszy na te ataki niż Sonnet 4.5 i osiąga wyniki zbliżone do Opus 4.6.

Co w praktyce oznacza 1 milion tokenów kontekstu?

Okno kontekstowe 1 miliona tokenów (w fazie beta) to tyle, żeby zmieścić całe repozytorium kodu, dziesiątki dokumentów PDF albo kilkanaście obszernych raportów w jednym zapytaniu. Ale sam rozmiar to dopiero połowa sukcesu – Sonnet 4.6 efektywnie rozumuje w poprzek całego tego kontekstu, a nie tylko przywołuje fragmenty.

Widać to najlepiej na benchmarku Vending-Bench Arena, który testuje zdolność modelu do prowadzenia symulowanego biznesu przez długi czas, z elementem rywalizacji między modelami AI. Sonnet 4.6 wypracował interesującą strategię: przez pierwsze dziesięć symulowanych miesięcy agresywnie inwestował w moce produkcyjne, a następnie gwałtownie przestawił się na maksymalizację zysku w końcowej fazie. Wygrał.

Porównanie benchmarków

Benchmark	Claude Sonnet 4.6	Claude Sonnet 4.5	Claude Opus 4.5 / 4.6
OSWorld (computer use)	znaczna poprawa	baseline	porównywalny (Opus 4.6)
SWE-bench Verified (coding)	~80% (z modyfikacją promptu)	niższy	Opus wciąż lider
Vending-Bench Arena	1. miejsce	niższy	—
OfficeQA (Databricks)	= Opus 4.6	niższy	punkt odniesienia
Insurance benchmark (Pace)	94%	niższy	—

Wniosek: Sonnet 4.6 zamknął dużą część luki do Opus 4.5 przy tej samej cenie co Sonnet 4.5. Opus 4.6 wciąż wygrywa przy zadaniach wymagających najgłębszego rozumowania – refaktoryzacja dużych baz kodu, koordynacja wielu agentów. Do reszty Sonnet 4.6 w zupełności wystarczy.

Co mówią klienci enterprise?

Anthropic opublikowało referencje od kilkunastu firm. Kilka wyróżniających się obserwacji:

„Claude Sonnet 4.6 matches Opus 4.6 performance on OfficeQA, which measures how well a model can read enterprise documents – charts, PDFs, tables – pull the right facts and reason from those facts.”

— Hanlin Tang, CTO Neural Networks, Databricks

„For the first time, Sonnet brings frontier-level reasoning in a smaller and more cost-effective form factor.”

— Jeff Wang, CEO, Windsurf

Niezależnie od siebie firmy zwracały uwagę na lepsze efekty wizualne w generowaniu frontend code – bardziej dopracowane layouty i animacje bez potrzeby wielokrotnych iteracji. Wyróżniała się też wyraźna poprawa w analizie złożonych dokumentów finansowych i enterprise.

Nowe funkcje w API i na platformach

Adaptive thinking i extended thinking

Na Claude Developer Platform Sonnet 4.6 obsługuje zarówno adaptive thinking, jak i extended thinking. Model działa dobrze na każdym poziomie wysiłku myślowego – nawet z wyłączonym extended thinking. Anthropic zaleca przetestowanie całego spektrum ustawień przy migracji z Sonnet 4.5.

Context compaction (beta)

Context compaction automatycznie podsumowuje starszy kontekst, gdy rozmowa zbliża się do limitu okna. W praktyce wydłuża to efektywny kontekst i pozwala prowadzić długie sesje agentyczne bez ręcznego zarządzania historią.

Nowe narzędzia API w ogólnej dostępności

Do GA przeszły: code execution, memory tool, programmatic tool calling, tool search i tool use examples. Narzędzia web search i fetch zyskały automatyczne filtrowanie wyników przez wykonywanie kodu – lepsza jakość odpowiedzi przy niższym zużyciu tokenów.

Claude in Excel + MCP connectors

Add-in dla Excela obsługuje teraz MCP connectors. Claude może sięgać po dane z zewnętrznych narzędzi (S&P Global, PitchBook, FactSet, Moody’s, LSEG, Daloopa) bez opuszczania arkusza. Jeśli masz już skonfigurowane MCP w Claude.ai, te same połączenia działają w Excelu automatycznie. Dostępne na planach Pro, Max, Team i Enterprise.

Jak zacząć korzystać?

Model jest dostępny natychmiast na wszystkich planach Claude, w Claude Code, przez API Claude, na Amazon Bedrock i Google Cloud Vertex AI. Darmowy tier dostał upgrade – teraz domyślnie obejmuje tworzenie plików, connektory, skills i context compaction.

Dla deweloperów: wystarczy zmienić model w wywołaniu API na claude-sonnet-4-6.

Źródła

Introducing Claude Sonnet 4.6 – Anthropic

Te artykuły powinny Cię zainteresować

O autorze

Nazywam się Michał Małysa i od wielu lat zajmuję się zawodowo SEO oraz analizą treści, a od 2023 roku w zakres moich obowiązków i zainteresowań dość naturalnie weszło AI. Na stronie MałySEO porządkuję wiedzę o pozycjonowaniu stron internetowych, AI Search oraz działaniu LLM-ów. Prowadzę również MałySEO Newsletter, do którego subskrypcji serdecznie Cię zachęcam na podstronie najlepszego w Polsce newslettera SEO.

Jako że przygotowanie materiałów do MałySEO Newslettera oraz na bloga zajmuje nieco czasu, może zaświtać Ci w głowie dość miły z mojej perspektywy pomysł drobnego rewanżu. Jeżeli uznasz, że lektura tego wpisu była dla Ciebie czymś więcej, niż tylko szybkim odklepaniem randomowej internetowej treści, możesz postawić mi kawkę na buycoffee.to. Z góry dziękuję!

Jeżeli z jakiegoś powodu potrzebujesz się ze mną skontaktować, wyślij mail na adres kontakt[at]michalmalysa.pl