谷歌发布旗舰AI模型Gemini的增压版

币圈子 2024-06-29 阅读:100

在上个月为开发者发布测试版后,谷歌兑现了向公众开放其最强大的人工智能模型Gemini 1.5 Pro的承诺。

谷歌的Gemini 1.5 Pro能够处理比以前的其他人工智能模型更复杂的任务,例如分析整个文本库、长篇好莱坞电影,或者几乎一整天的音频数据。这是OpenAI的GPT-4o的20倍数据,也是Anthropic的Claude 3.5 Sonnet能够管理的信息的近10倍。

谷歌在其公告中表示,目标是将更快、更低成本的工具交到人工智能开发人员手中,并“实现新的用例、额外的生产稳健性和更高的可靠性”

图片:谷歌

谷歌此前于5月推出了该模型,展示了一组经过挑选的测试人员如何利用其功能的视频。例如,机器学习工程师Lukas Atkins向模型提供了整个Python库,并提出了一些问题来帮助他解决问题。他在视频中说:“它抓住了它。”。“它可以在代码中找到对评论的具体引用,以及人们提出的具体要求。”

另一位测试人员拍摄了他的整个书架的视频,Gemini创建了一个他所有书籍的数据库——这是传统人工智能聊天机器人几乎不可能实现的任务。

Gemma 2主宰开源空间

但谷歌也在开源社区掀起了波澜。根据LLM Arena排名,该公司今天发布了Gemma 2 27B,这是一款开源大型语言模型,它以最高质量的响应迅速占据了开源模型的宝座。

谷歌声称Gemma 2提供了“一流的性能,在不同硬件上以惊人的速度运行,并可以轻松地与其他人工智能工具集成。”该公司表示,它旨在与“两倍于其规模”的模型竞争。

图片:谷歌

Gemma 2的许可证允许免费访问和重新分发,但仍然与MIT或Apache等传统开源许可证不同。该模型设计用于27B和较小的9B版本中更易于访问和预算友好的人工智能部署。

这对普通用户和企业用户都很重要,因为与封闭模型不同,像Gemma这样强大的开放模型是高度可定制的。这意味着用户可以微调他们的模型,使其擅长于特定的任务,通过在本地运行这些模型来保护他们的数据。

例如,微软的小型语言模型Phi-3专门针对数学问题进行了微调,在该领域可以击败Llama-3甚至Gemma 2等大型模型。

图片:Microsoft

Gemma 2现在可以在谷歌人工智能工作室中使用,模型权重可以从Kaggle和Hugging Face Models下载,强大的Gemini 1.5 Pro可供开发人员在Vertex AI上测试。


二维码