谷歌近期對其 Gemini API 的計費結(jié)構(gòu)進(jìn)行了更新,旨在更好地滿足用戶的推理使用需求。這次更新帶來了多種新的服務(wù)檔位,包括標(biāo)準(zhǔn)、彈性、優(yōu)先、批量和緩存版。用戶可以根據(jù)自身的實際需求選擇最合適的檔位。
首先,標(biāo)準(zhǔn)檔位提供了基礎(chǔ)的推理服務(wù),用戶可以根據(jù)自己的使用情況進(jìn)行選擇。彈性檔位則是一個創(chuàng)新的選擇,它利用非高峰時段的閑置算力資源,為用戶提供了標(biāo)準(zhǔn)價格的五折優(yōu)惠。這個檔位的目標(biāo)延遲在 1 至 15 分鐘之間,但并不保證固定的延遲時間,適合那些對時間要求不太嚴(yán)格的應(yīng)用場景。
批量檔位同樣為用戶提供了標(biāo)準(zhǔn)費率的五折優(yōu)惠,適合需要處理大量數(shù)據(jù)的用戶,延遲時間最長可達(dá) 24 小時。此檔位特別適用于大規(guī)模的數(shù)據(jù)處理場景,用戶在進(jìn)行大量信息查詢時可以大大節(jié)省成本。
在緩存檔位方面,計費將依據(jù)緩存的詞元數(shù)量與存儲時長進(jìn)行,特別適合需要頻繁調(diào)用復(fù)雜指令的對話機(jī)器人、長視頻分析或大規(guī)模文檔集的查詢。這個檔位使得用戶能夠有效管理存儲和計算資源,提高系統(tǒng)的運(yùn)行效率。
優(yōu)先檔位的定價則比標(biāo)準(zhǔn)價格高出 75% 至 100%,但能夠在毫秒到秒級內(nèi)控制延遲。這一檔位非常適合那些需要實時響應(yīng)的應(yīng)用,如客服聊天機(jī)器人、實時欺詐檢測和關(guān)鍵業(yè)務(wù)智能助手等場景。谷歌建議有需求的用戶選擇優(yōu)先檔位,以確保他們的應(yīng)用程序在響應(yīng)速度和效率上的最佳表現(xiàn)。
劃重點:










