Google presenta i modelli avanzati della serie Gemini 1.5 e riduce i prezzi delle API del 50%

Google presenta i modelli avanzati della serie Gemini 1.5 e riduce i prezzi delle API del 50%

Oggi, Google ha presentato due modelli Gemini 1.5 migliorati e pronti per la produzione: Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002. Questi ultimi modelli offrono miglioramenti incrementali rispetto ai modelli Gemini 1.5 originali rilasciati a maggio.

I modelli della serie Gemini 1.5 rivisti raggiungono un aumento di circa il 7% in MMLU-Pro, un miglioramento di circa il 20% nei benchmark MATH e HiddenMath e miglioramenti che vanno dal 2% al 7% negli scenari di visione e codifica. Inoltre, Google ha perfezionato l’utilità complessiva delle risposte del modello. Questi modelli ora generano risposte in un formato più conciso, con la lunghezza di output predefinita più corta di circa il 5% al ​​20% rispetto ai loro predecessori.

Oltre ai miglioramenti nella funzionalità del modello, Google sta anche implementando un cambiamento notevole nei prezzi: sta riducendo il costo delle API del modello della serie Gemini 1.5.

  • Una riduzione del 64% sui token di input.
  • Una riduzione del 52% sui token di output.
  • Una riduzione del 64% sui token incrementali memorizzati nella cache per Gemini 1.5 Pro, a partire dal 1° ottobre 2024, per i prompt con token inferiori a 128K.
Modelli Google 1.5 Pro

Google sta anche aumentando i limiti di velocità, consentendo agli sviluppatori di creare applicazioni AI sofisticate. I limiti di velocità a pagamento per il modello Gemini 1.5 Flash sono ora 2.000 RPM, mentre per il modello Pro sono aumentati a 1.000 RPM, rispetto a 1.000 e 360, rispettivamente. Inoltre, c’è una riduzione della latenza con questi nuovi modelli, offrendo agli sviluppatori un output previsto che è due volte più veloce e tre volte meno latenza.

Con il lancio dell’aggiornamento Gemini 1.5 (modelli -002), Google ha migliorato la capacità del modello di aderire alle istruzioni dell’utente mantenendo al contempo i protocolli di sicurezza. Per impostazione predefinita, Google non applicherà filtri di sicurezza dei contenuti AI su questi ultimi modelli; al contrario, gli sviluppatori possono applicare i filtri in base alle loro esigenze specifiche.

Infine, Google ha lanciato una versione aggiornata del modello Gemini 1.5 nota come “Gemini-1.5-Flash-8B-Exp-0924”. Questa versione sperimentale mostra miglioramenti significativi nelle prestazioni sia nelle applicazioni testuali che multimodali. Tutti questi modelli Gemini 1.5 aggiornati sono ora accessibili agli sviluppatori tramite Google AI Studio e la Gemini API. Per le aziende più grandi e i clienti di Google Cloud, questi modelli Gemini 1.5 appena aggiornati sono disponibili su Vertex AI.

Fonte

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *