xChar

Google DeepMind的最新版本 Gemini Exp 1114,在Chatbot Arena上取得了重要成就,凭借超过6000个社区投票,跃升至总榜第1,并在多个领域表现出色:

首先,我们要理解LLM Arena是什么。LLM Arena(或称聊天机器人竞技场)是一个评估LLM的平台,主要目标是促进社区驱动的LLM性能评估。它是最有声望的评估平台之一。

https://lmarena.ai/

image

从总榜来看,谷歌新模型Gemini(Exp 1114)分数直涨40+,得分为1344,而 ChatGPT 4.0最新版本的得分是1340。谷歌旗下的模型这好像还是第一次有这样的成绩。

3f911749b2df6a302d0cddcb8e9a4b5d

Gemini-Exp-1114 在数学竞技场中并列第一,性能匹敌 o1:

image
目前,Gemini-Exp-1114 可以在谷歌AI Studio 对话体验

https://aistudio.google.com/

image

The Terminator is coming

image

Loading comments...