Iată-ne ajunși la al doilea episod din Techtomatul Săptămânii, o recapitulare a celor mai importante știri din tehnologie, din perspectiva mea. Săptămâna aceasta a fost dominată clar de inteligența artificială, cu lansări și anunțuri importante de la giganții industriei, care par să se întreacă în a demonstra cine are cel mai performant model.
Google a lansat oficial un model multimodal care a impresionat pe toată lumea sub un pseudonim, Microsoft și-a prezentat în sfârșit creațiile proprii pentru a nu mai depinde de OpenAI, iar Meta a implementat măsuri noi de siguranță pentru adolescenți, în urma presiunilor externe. Să le luăm pe rând și să vedem ce înseamnă fiecare dintre aceste mișcări.
Google lansează oficial „Nano Banana”, sau Gemini 2.5 Flash Image
Pe 26 august, Google a dezvăluit oficial modelul de inteligență artificială cunoscut sub numele de cod „Nano Banana”, al cărui nume oficial este Gemini 2.5 Flash Image.
Modelul a funcționat anonim timp de săptămâni pe platforma LMArena, unde a impresionat utilizatorii prin capacitățile sale superioare, fără ca nimeni să știe că în spate se află Google. Acest model se remarcă în special prin abilitățile de editare a imaginilor, oferind o consistență aproape perfectă și permițând utilizatorilor să facă modificări complexe folosind doar limbajul natural.
Printre funcționalitățile cheie se numără fuzionarea elementelor din mai multe fotografii într-o compoziție coerentă și o viteză de procesare care permite generarea de editări profesionale în doar câteva secunde. Performanța sa a fost validată de comunitate: modelul a atins primul loc pe LMArena, cu peste 2.5 milioane de voturi și cel mai mare avantaj de punctaj ELO din istoria platformei (171 de puncte). Vestea bună este că Gemini 2.5 Flash Image este deja disponibil gratuit în aplicația Gemini și pentru dezvoltatori prin Gemini API.
Microsoft își prezintă primii săi modele de IA dezvoltate intern
Pe 28 august, a venit și rândul Microsoft să iasă în față, prezentându-și primele modele de inteligență artificială dezvoltate intern: MAI-Voice-1 și MAI-1-preview. Mișcarea este una strategică și marchează un pas important spre independența tehnologică a companiei față de OpenAI, arătând că Microsoft nu se mai bazează exclusiv pe parteneriatul cu aceștia pentru a concura în cursa AI.
MAI-Voice-1 se remarcă prin eficiența sa în generarea de conținut audio, fiind capabil să creeze un minut complet de sunet în mai puțin de o secundă, folosind un singur GPU. De altfel, tehnologia este deja integrată în Copilot Daily pentru a nara știrile. Pe de altă parte, MAI-1-preview este modelul de text fundamental al companiei, antrenat pe o infrastructură impresionantă de aproximativ 15.000 de unități GPU Nvidia H100, ceea ce subliniază seriozitatea investiției Microsoft în acest domeniu.
Meta implementează noi măsuri de siguranță pentru adolescenți
Schimbând puțin registrul, pe 29 august, Meta a anunțat actualizări importante pentru chatbot-urile sale AI, menite să protejeze mai bine utilizatorii adolescenți. Aceste măsuri vin ca răspuns la un raport Reuters care a ridicat semne de întrebare privind siguranța minorilor pe platformele Meta, ducând la o investigație a Senatului american.
Noile reguli includ restricții automate pentru a evita subiectele nepotrivite în discuțiile cu minorii, oferirea de răspunsuri mai conservatoare și precaute în conversații care ar putea fi sensibile și, în general, o supraveghere sporită a interacțiunilor. Este un pas necesar din partea companiei pentru a se alinia la cerințele de siguranță și pentru a oferi un mediu mai controlat pentru utilizatorii tineri, într-o perioadă în care interacțiunile cu inteligența artificială devin tot mai comune.