谷歌发布旗舰AI模型Gemini的增压版

在上个月为开发者发布测试版后，谷歌兑现了向公众开放其最强大的人工智能模型Gemini 1.5 Pro的承诺。

谷歌的Gemini 1.5 Pro能够处理比以前的其他人工智能模型更复杂的任务，例如分析整个文本库、长篇好莱坞电影，或者几乎一整天的音频数据。这是OpenAI的GPT-4o的20倍数据，也是Anthropic的Claude 3.5 Sonnet能够管理的信息的近10倍。

谷歌在其公告中表示，目标是将更快、更低成本的工具交到人工智能开发人员手中，并“实现新的用例、额外的生产稳健性和更高的可靠性”

图片：谷歌

谷歌此前于5月推出了该模型，展示了一组经过挑选的测试人员如何利用其功能的视频。例如，机器学习工程师Lukas Atkins向模型提供了整个Python库，并提出了一些问题来帮助他解决问题。他在视频中说：“它抓住了它。”。“它可以在代码中找到对评论的具体引用，以及人们提出的具体要求。”

另一位测试人员拍摄了他的整个书架的视频，Gemini创建了一个他所有书籍的数据库——这是传统人工智能聊天机器人几乎不可能实现的任务。

Gemma 2主宰开源空间

但谷歌也在开源社区掀起了波澜。根据LLM Arena排名，该公司今天发布了Gemma 2 27B，这是一款开源大型语言模型，它以最高质量的响应迅速占据了开源模型的宝座。

谷歌声称Gemma 2提供了“一流的性能，在不同硬件上以惊人的速度运行，并可以轻松地与其他人工智能工具集成。”该公司表示，它旨在与“两倍于其规模”的模型竞争。

图片：谷歌

Gemma 2的许可证允许免费访问和重新分发，但仍然与MIT或Apache等传统开源许可证不同。该模型设计用于27B和较小的9B版本中更易于访问和预算友好的人工智能部署。

这对普通用户和企业用户都很重要，因为与封闭模型不同，像Gemma这样强大的开放模型是高度可定制的。这意味着用户可以微调他们的模型，使其擅长于特定的任务，通过在本地运行这些模型来保护他们的数据。

例如，微软的小型语言模型Phi-3专门针对数学问题进行了微调，在该领域可以击败Llama-3甚至Gemma 2等大型模型。

图片：Microsoft

Gemma 2现在可以在谷歌人工智能工作室中使用，模型权重可以从Kaggle和Hugging Face Models下载，强大的Gemini 1.5 Pro可供开发人员在Vertex AI上测试。