开云体育
开云APP下载被DeepSeek卷到谷歌狂杀性价比新模型得分超R1速度暴碾4o-mini
谷歌AI Studio产品负责人Logan Kilpatrick在X发帖称,这几款“谷歌史上最强大的模型”现可供所有开发人员使用。
▲Chatbot Arena大模型排行榜Language总榜,综合考虑了大模型的数学、编码、多语种处理等方面的能力(图源:Chatbot Arena官网)
同时,Lite版本针对大规模文本输出的场景实现了成本优化,每百万tokens文本输出定价0.3美元。谷歌CEO桑达尔皮查伊(Sundar Pichai)用“高效且强大”来形容这款模型。
相比于Lite版,Gemini 2.0 Flash的多模态交互功能更全面一些,按计划可支持图像输出,以及文本、音频、视频等模态的双向实时低延迟输入和输出。
而Gemini 2.0 Pro实验版则是谷歌自称旗下在编码性能和复杂提示方面表现最好的模型。该模型的上下文窗口可达200万个tokens,通用能力较前代的75.8%提升至79.1%,编码和推理能力与Gemini 2.0 Flash、Gemini 2.0 Flash-Lite拉开了明显差距。
受开源、低成本、高性能DeepSeek-R1推出的影响,模型开发成本成为了圈内热议的线年第四季度财报刚发布不久,在电话会议上,皮查伊先是肯定了DeepSeek所实现的成绩,但同时也提出Gemini系列模型在
三者关系的平衡中,仍处于领先地位,且整体表现优于DeepSeek的V3和R1模型。而从由杨立昆及其团队搭建的LiveBench大模型性能基准测试排行来看,Gemini 2.0 Flash总体排名
,输出成本为0.4美元,两项数据均远低于DeepSeek V3。该网友在X上写道:“Gemini 2.0 Flash正式版成本为GPT-4o-mini的三分之一,同时速度是后者的3倍。”
DeepSeek掀起的这波大模型价格战,对海外大模型市场的直接或间接影响仍在持续。
谷歌推出比轻量级还轻量的Gemini 2.0 Flash-Lite,OpenAI向所有用户免费开放了ChatGPT搜索功能,Meta内部团队加紧研究大模型降价策略。
目前来看,大模型领域还没有哪家能稳坐第一的宝座,各项测评数据你追我赶,变相降价吸引和留存用户。卷性价比也有助于大模型从技术开发,真正走向后续的应用落地。