Google推最强开源模型Gemma!11项测试辗压Llama、可跑在笔电上,厉害在哪?

Google宣布推出全球性能最强大、轻量级的开源模型系列——Gemma。

虽然 Gemini 是一个大型封闭式人工智慧模型,与 OpenAI 的 ChatGPT 直接竞争(而且几乎一样强大),但轻量级的 Gemma 可能适用于较小的任务,如简单的聊天机器人或摘要。该模型共分为分为2B(20亿参数)和7B(70亿)两种版本,2B版本甚至可直接在笔电上运行。

Google表示,Gemma采用与Gemini模型相同的研究和技术,由Google DeepMind和Google其他团队开发,专为负责任的AI开发而打造。

Google声称,Gemma模型18个语言理解、推理、数学等关键基准测试中,有11个测试分数超越了Meta Llama-2等更大参数的开源模型。

平均分数方面,Gemma-7B的基准测试平均分高达56.4,远超过Llama-13B(52.2)、Mistral-7B(54.0),成为目前全球最强大的开源模型。

Google和Alphabet公司CEO桑达尔皮查伊(Sundar Pichai)表示,Gemma展示了强大的性能,从今天开始,该模型将在全球范围内提供服务。

Gemma规模虽较小,可直接在单机笔电上运作!厉害在哪?

Gemma实现了跨装置相容,可以在笔电、桌机、物联网、移动装置和云端等多个主流装置类型上运行,支援广泛的AI功能。

虽然不如同门的 Gemini 强大,不过,Gemma在复杂性上的不足,可能会在速度和使用成本上得到弥补。尽管规模较小,但Google声称,Gemma 模型“在关键基准测试中明显超越了更大的模型”,并且能够直接在开发人员的笔电或桌上型电脑运行。这些模型将通过 Kaggle、Hugging Face、NVIDIA 的 NeMo 和Google的 Vertex AI 提供。

Gemma 进入开源生态系统的方式与 Gemini 的发布方式截然不同。虽然开发者可以在 Gemini 的基础上进行开发,但他们不是透过 API,就是在Google的 Vertex AI 平台上进行开发。Gemini 被认为是一种封闭的人工智慧模式。

Gemma能用在哪?价钱多少?

现在,透过将 Gemma 开源,在战略上Google可以让更多的人尝试使用Google的人工智慧,而不是转向对手。

无论组织规模、使用者数量和项目类型如何,这两种尺寸的模型都将获得商业许可。不过,与其他公司一样,Google通常禁止将其模型用于武器开发项目等特定任务。

Gemma 还将提供“负责任的人工智慧工具包”,因为开放模型比 Gemini 等封闭系统更难设定防护措施。Google DeepMind 产品管理总监Warkentin 说,“由于开放模型的固有风险,公司对 Gemma 进行了更广泛的重新设计”。

负责任的人工智慧工具包允许开发人员在项目中部署 Gemma 时建立自己的准则或停用词列表。该工具包还包括一个模型侦错工具,可让使用者调查 Gemma 的行为并纠正问题。

Warkentin 表示,这些模型目前最适用于英语语言相关任务,希望能与社区合作,满足英语任务以外的市场需求。

开发人员可以在 Kaggle 中免费使用 Gemma,首次使用Google云的使用者可以获得 300 美元的免费额度来使用模型。该公司表示,研究人员最多可申请 500000 美元的额度。

虽然目前还不清楚人们对 Gemma 这样的小模型有多大需求,但其他人工智慧公司也推出了重量更轻的旗舰基础模型。Meta 去年推出了 Llama 2 7B,这是 Llama 2 的最小迭代版本。 Gemini 本身也有几种重量,包括 Gemini Nano、Gemini Pro 和 Gemini Ultra,Google最近宣布推出速度更快的 Gemini 1.5,目前也是针对企业使用者和开发人员。

顺便说一下,Gemma 的意思是宝石。

延伸阅读:Gemini其实不是要干掉ChatGPT!Google兵分三路想做什么?AI大战解析

本文授权转载自:T客邦
责任编辑:苏祐萱

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。