Google presenta l’intelligenza artificiale conveniente con Gemini 1.5 Flash-8B, il modello più economico di sempre

Google presenta l’intelligenza artificiale conveniente con Gemini 1.5 Flash-8B, il modello più economico di sempre

Il modello Gemini 1.5 Flash ha rapidamente guadagnato popolarità tra gli sviluppatori sin dal suo lancio, principalmente grazie alla sua impressionante velocità e convenienza economica. Ad agosto, Google ha introdotto Gemini 1.5 Flash 8B, un modello AI sperimentale progettato per ridurre ulteriormente i costi utilizzando solo 8 miliardi di parametri.

Dopo settimane di test con gli sviluppatori, Google ha annunciato oggi che Gemini 1.5 Flash 8B è ora pronto per la produzione. Questo modello eccelle nelle applicazioni multimodali ad alto volume, nelle attività di riepilogo di contesto lungo e molto altro. Rispetto al Flash 1.5 originale, il nuovo modello 1.5 Flash 8B è più conveniente del 50%, supporta limiti di velocità 2 volte superiori e offre una latenza ridotta per prompt più piccoli.

Per quanto riguarda le prestazioni, il Flash 8B 1.5 è molto simile al modello Flash 1.5 lanciato a maggio. È particolarmente abile nel gestire attività come interfacce di chat, trascrizione e traduzione di lingue di contesto lungo. Di seguito è riportato un confronto dei risultati di benchmark per questo nuovo modello.

Gemelli 1.5 Flash 8B

La caratteristica distintiva del modello 8B è la sua convenienza, che rende Gemini 1.5 Flash 8B il modello AI più economico di Google fino ad oggi. Ecco una ripartizione dettagliata dei prezzi:

  • $ 0,0375 per 1 milione di token sui prompt
  • $ 0,15 per 1 milione di token sui prompt
  • $ 0,01 per 1 milione di token su prompt memorizzati nella cache

Per soddisfare le applicazioni AI ad alto volume, Google sta anche aumentando il limite di velocità per questo modello. Gemini 1.5 Flash 8B ora supporta 4.000 richieste al minuto (RPM), il doppio del limite precedente.

Gli sviluppatori interessati a esplorare il nuovo modello gemini-1.5-flash-8b possono registrarsi per un accesso gratuito tramite Google AI Studio e la Gemini API. Per gli sviluppatori a pagamento, la fatturazione per questo modello innovativo inizierà lunedì 14 ottobre.

Grazie al suo eccezionale mix di prestazioni, convenienza e accessibilità, il modello Gemini 1.5 Flash 8B di Google è destinato a diventare la soluzione di intelligenza artificiale preferita dagli sviluppatori di diversi settori.

Fonte: Google

Fonte

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *