Anthropic a lansat Sonnet 4.6, o versiune care nu pune accent pe funcții exotice, ci pe fiabilitate, având rolul de a executa corect comenzile primite de la utilizator încă de la prima încercare.
Această lansare transformă modelul într-un instrument pe care ne putem baza. Dacă ați pierdut timp repetând cereri sau corectând răspunsuri eronate, știți cât de necesară este o alternativă stabilă. Sonnet 4.6 este pasul către un AI care funcționează exact atunci când ai nevoie.
Mai performant
Marea problemă a modelelor actuale este inconsistența. Sonnet 4.6 rezolvă acest aspect: ascultă instrucțiunile, nu inventează soluții inutile și nu se pierde în detalii. Conform comunicatului, în testele preliminare (îndeosebi în „Claude Code”), utilizatorii l-au preferat în proporție de 70% față de predecesorul său, Sonnet 4.5. Mai mult, în sarcini de raționament complex și analiză de documente (OfficeQA), modelul ajunge să egaleze performanțele noului vârf de gamă, Opus 4.6.
Pe partea de utilizare a computerului (benchmark-ul OSWorld), modelul a atins un nivel de acuratețe remarcabil, gestionând sarcini complexe — precum navigarea în foi de calcul stufoase sau completarea de formulare web în pași multipli — cu o precizie aproape umană.
Mai permisiv
Limita de context este adesea frustrantă, iar cei de la Anthropic știu asta. Sonnet 4.6 vine cu o fereastră de 1 milion de tokeni, permițând încărcarea unor baze întregi de cod sau zeci de documente PDF fără a pierde firul logic. Testele arată că poate planifica strategii pe termen lung fără a uita detaliile inițiale, fiind ideal pentru sarcini care cer o înțelegere profundă a arhitecturii unui proiect.
Mai sigur
Un accent major în această versiune a fost pus pe reducerea halucinațiilor și a „sycophancy” (tendința AI-ului de a fi de acord cu utilizatorul, chiar și atunci când premisele sunt greșite). Sonnet 4.6 este semnificativ mai onest și mai rezistent la erori de logică decât versiunile anterioare.
Un avantaj major este integrarea nativă cu instrumente de business prin conectori MCP. Putem rula analize complexe pe date din surse externe direct în foile de calcul sau platformele interne, fără importuri manuale laborioase, modelul comportându-se ca un agent autonom capabil.
Când și de ce
Dacă costurile nu ar constitui un criteriu de selecție, aș renunța în acest moment la abonamentul Gemini în favoarea unuia la Claude. Totuși, realitatea este că, pentru mine, pachetul Google AI Pro înclină balanța: cei 2 TB de stocare în Google Drive, împreună cu accesul la instrumente extrem de utile precum NotebookLM și Jules, oferă o valoare greu de ignorat.
Altfel spus, Claude este asul din mânecă la care apelez atunci când modelul celor de la Google începe să se învârtă în cerc sau când am de gestionat fișiere de cod stufoase, unde Gemini își arată limitele, ignorând contextul.
Dacă principala mea sursă de venit ar depinde critic de AI, cu Sonnet 4.6, Claude ar fi depășit statutul de simplă rezervă; este instrumentul pe care îl prefer pentru precizie, demonstrând o superioritate irefutabilă.


