Weekend. Sunt de gardă, deci trebuie să stau aproape de pc și telefon. Cumva, îmi prinde bine „arestul la domiciliu”, pentru că am o problemă ce mă scoate din minți: scorul prost la LCP al blogului, care mă bântuie de aproape o lună. Am depistat-o prin octombrie, dar n-am reușit să-i găsesc cauza nici cu ajutorul AI-ului. De altfel, a fost unul dintre motivele pentru care am renunțat la Gemini, dezamăgit de cât de prost se descurca la programare, așa că era un moment bun să-mi fac abonament la Claude Pro și să-i dau de lucru. Zis și făcut.
Am trecut direct la Opus, modelul lor cel mai puternic. Ca să nu-l pun pe drumuri degeaba, i-am dat vreo 25 de fișiere PHP suspecte. Claude le-a analizat, mi-a oferit sugestii, am testat, am iterat, dar n-am reușit să rezolv problema înainte să mă blocheze.
Toate astea au însemnat cel mult 20-30 de minute de lucru efectiv, răspândite pe parcursul a două ore (că între teste mai răspundeam la apeluri, mai aruncam un ochi pe Stack Overflow, ca un programator adevărat).
Prima reacție: enervare. Păi cum, asta e tot? Dacă am nevoie de el doar în weekend, de ce trebuie să aștept o săptămână să-mi continui treaba? Mi s-a părut absurd. „Dați-mi credite și lăsați-mă să le ard cum vreau eu!” – mi-am zis. Și, impulsiv cum sunt, am anulat abonamentul chiar în acel moment.
Dar după ce mi-a trecut frustrarea și creierul și-a reluat activitatea, am realizat ceva interesant: la GPT și Gemini, când treci de limita plătită, rămâi cu modelul gratuit. Slab, dar util. Claude? Îți taie tot. Deși inițial mi s-a părut o prostie, poate nu e vina lor. Poate problema e la mine, la noi, la așteptările noastre (prost, nimic de zis, dar cu apucături de filosof!).
Și am început să sap. Ce am descoperit mi-a schimbat complet perspectiva.
Ne-am obișnuit prea repede cu AI-ul ieftin
Plătim 20-25 de euro pe lună pentru acces la o inteligență artificială avansată și ni se pare mult. O comparăm cu Netflix, cu Spotify, cu abonamentul la sala de fitness. Dar AI-ul nu e un film pe un server și nici o melodie care se redă în buclă. Pentru ca acesta să-ți spună cât ești de deștept și creativ, în spate se află o infrastructură fizică uriașă, infrastructura care a trebuit construită și care consumă energie cât un oraș și, pe deasupra, se uzează într-un ritm îngrijorător.
Noi plătim 25 de euro pe lună. Adevăratul cost? Poate de zece ori mai mult. Bun, atunci, cine face cinste cu diferența? Investitorii, fondurile de risc, companii ce pierd bani ca să câștige piață. Petrecerea e pe banii lor. Întrebarea e: cât mai durează? Modelul economic actual, din câte m-a dus mintea să înțeleg, pare la fel de sustenabil ca și creditele pe buletin. Adică deloc.
Crearea AI-ului costă mult, dar rularea lui costă și mai mult
Când citești despre costuri AI, toată lumea vorbește despre antrenament: sute de milioane de dolari pentru GPT-4 sau Claude Opus. E mult, dar, totuși, e un cost unic. Partea grea vine după: rularea continuă, adică inferența.
Fiecare interogare, fiecare conversație, fiecare test consumă resurse. O singură instanță performantă pe AWS costă peste 27.000 de dolari pe lună. Iar companiile nu rulează una, ci mii. În fiecare secundă, milioane de interogări se traduc în costuri reale, arse în timp real și la propriu, și la figurat.
Și mai ciudat e că, deși costurile astea sunt evidente, un sondaj recent arăta că doar 8% dintre liderii industriei se gândeau serios să limiteze accesul pentru a controla cheltuielile. Restul de 92%? Poate vor popularitate, habar n-am, nu-i cunosc personal, altfel i-aș întreba. E ca și cum ai cumpărar un Ferrari și, deși benzina te costă 500 de euro pe zi, ai da cheile oricui să se plimbe doar ca să ai mulți prieteni.
Industria încearcă soluții. FrugalGPT, de exemplu, trimite întrebările întâi către modele ieftine (GPT-3.5, de exemplu) și doar dacă nu reușesc, le pasează celor scumpe (GPT-4, GPT-5). Asta reduce costurile cu până la 98%. Faptul că astfel de „economii extreme” sunt necesare spune totul despre cât de fragil e sistemul actual.
Hardware-ul: nu e investiție, e consumabil
Când auzi „centru de date”, te gândești la servere care merg ani de zile. Dar „fabricile AI” sunt altceva. Un GPU NVIDIA H100 costă 40.000 de dolari. Și, conform inginerilor Google, cedează destul de rapid în regim de utilizare AI 24/7, cam între 1 și 3 ani, după care trebuie înlocuite.
O „gigafabrică” AI cu un milion de cipuri? 40 de miliarde de dolari ce trebuie reinvestiți complet la fiecare trei ani. Asta nu e infrastructură durabilă. E un abonament uriaș la hardware. Când companiile vorbesc despre „fabrici AI” ca despre investiții generaționale, exagerează. În realitate sunt niște platforme consumabile cu o notă de plată recurentă astronomică.
Energia – elefantul din cameră
O interogare ChatGPT consumă de zece ori mai multă energie decât o căutare Google. Pare puțin până înmulțești cu miliarde. Centrele de date mănâncă deja 4% din electricitatea SUA și ar putea ajunge la aproape 10% până în 2030. În Irlanda, ar putea reprezenta o treime din consumul național în doar un an.
Și mai grav, infrastructura energetică nu ține pasul. Construiești un centru de date în doi ani, dar îți ia patru sau cinci să tragi liniile de înaltă tensiune. Rezultatul? Centre gata de funcționare, dar fără curent suficient.
Petrecerea se apropie de final?
După cum spuneam și mai devreme, ne-am obișnuit cu ideea că totul trebuie să fie ieftin: streaming nelimitat, zboruri low-cost, stocare „nelimitată” în cloud. AI-ul nu doar a intrat în același film, e chiar actorul principal. Dar realitatea fizică nu negociază: GPU-urile se uzează, energia costă, rețelele trebuie construite.
Faptul că m-a blocat Claude după 30 de minute m-a enervat pe moment, dar analizând motivele am ajuns la concluzia că așa ar trebui să arate o piață matură. Una care nu mai merge pe subvenții și hype, ci pe raportul dintre costuri și beneficii.
Anthropic pur și simplu nu-și permite să-mi vândă acces nelimitat la Opus cu 25 de euro, când costul real e probabil de zece ori mai mare. Limitarea asta nu e o decizie arbitrară menită să mă frustreze, mai ales când concurența oferă acces (aparent) mai generos. E rezultatul acelui calcul matematic menit să satisfacă acționari și contabili.
Trial-ul global la AI avansat aproape-gratuit se va termina. Poate nu mâine, poate nu anul viitor, dar e inevitabil. Când factura reală va ajunge la noi, s-ar putea să nu ne mai convină.
Poate vor apărea optimzări miraculoase. Dar dacă nu apar?
Câți ar plăti 300 de euro pe lună pentru un AI cu performanțelor actuale ale GPT sau Gemini? Probabil foarte puțini. Eu, unul, știu sigur că nu m-aș număra printre ei.
Edit Claude m-a blocat și bine mi-a făcut



Foarte bun articolul. Foarte bine exprimat și articulat. Din același motiv, pe care l-ai descris tu mai sus, gen: o căutare chatGPT e mai scumpă de zece ori decât o căutare Google, eu folosesc doar căutarea Google încă și nu vreun AI performant sau slab. Poate e doar lenea proverbială sau obișnuință repetată la nesfârșit, dar dacă în felul acesta se economisesc, bani și energie, mă super felicit singur încă o dată și pe această cale, aș atrage atenția tuturor că putem încă folosi căutarea Google și în acest fel să salvăm planeta, și chiar pe noi. Până la urmă ce poate AI-ul și nu poate căutarea Google? întreb doar că idee? eu am 3 telefoane și pe absolut nici unul dintre ele, nu am instalat vreun AI, doar Google și atât. Nici nu știu care AI ar fi mai bun pe telefon? care este gratuit și care nu? și atunci în lipsa acestor răspunsuri, prefer ceea ce cunosc mai bine, și anume, căutarea Google. Deci, economie, pe toate planurile. Și în felul acesta, nu sunt nevoit deja, sa instalez, HyperOS 3, care l-am instalat deja pe unul dintre telefoane, și precizez, nu mi-a plăcut deloc, și nu am cum să-l dau înapoi. Deci, lucrurile de bază, rămân poate cele mai bune și nu tot ce este mai nou, nu se potrivește mănușă. Care este părerea ta despre cel mai buna AI de pe telefon? și care crezi că ar trebui instalat, că să înlocuiască căutarea Google? dacă se poate să fie și gratis, ar fi poate și mai bine? Eu spre exemplu nu știu nici măcar să folosesc încercuiește și caută a lui Google, sunt tot cu scrisul în căutare și așteptarea răspunsului.
Îți recomand Perplexity pentru documentare, deoarece se aliniază perfect cerințelor tale. Gândește-te la el nu ca la un motor de căutare direct, ci ca la un expert care efectuează căutările pentru tine, pe baza indicațiilor pe care i le oferi.
Am și eu o nedumerire: de ce folosești un nou nume de fiecare dată când comentezi?