andrewji8: "Google DeepMind的最新版本 Gemini Exp 1114，在Chatbot Arena上取得了重要成就，"

andrewji8·6 days ago

Google DeepMind的最新版本 Gemini Exp 1114，在Chatbot Arena上取得了重要成就，凭借超过6000个社区投票，跃升至总榜第1，并在多个领域表现出色：

首先，我们要理解LLM Arena是什么。LLM Arena（或称聊天机器人竞技场）是一个评估LLM的平台，主要目标是促进社区驱动的LLM性能评估。它是最有声望的评估平台之一。

从总榜来看，谷歌新模型Gemini（Exp 1114）分数直涨40+，得分为1344，而 ChatGPT 4.0最新版本的得分是1340。谷歌旗下的模型这好像还是第一次有这样的成绩。

3f911749b2df6a302d0cddcb8e9a4b5d

Gemini-Exp-1114 在数学竞技场中并列第一，性能匹敌 o1：

目前，Gemini-Exp-1114 可以在谷歌AI Studio 对话体验

The Terminator is coming

Drag and drop your files here

Loading comments...

Crossbell Chain

IPFS

Source