谷歌更新了Android Bench基准测试榜单,新增了Gemini 3.5 Flash的评测数据。结果显示,该模型在Android开发场景中表现欠佳,仅排名第六,不仅落后于GPT 5.5和Gemini 3.1 Pro Preview,性能差距达9%,延迟更高,且每次基准测试平均花费147.1美元,token用量是Gemini 3.1 Pro Preview的约3倍。尽管Gemini 3.5 Fl ...