AI搜索引擎来了，发布最强AI模型！

Ailiaili7652211个月前

公众号：Ailiaili | AI软件网
Ai项目交流群，Ai账号交易充值，Ai软件分享,Ai网站导航,Ai工具大全等
复制公众号

尽管OpenAI先行发布了令人瞩目的新品演示，但谷歌以其后发制人的策略，成功推出了人工智能（AI）搜索引擎，巩固了其在搜索领域的王者地位。同时，谷歌也以升级版的最强大AI模型Gemini迎战OpenAI新发布的旗舰模型GPT-4，展现了其在AI技术领域的深厚实力。

在北京时间5月15日凌晨1点开始的年度I/O开发者大会Keynote演讲中，谷歌CEO Sundar Pichai强调，谷歌的所有工作都紧密围绕生成式AI模型Gemini展开，旨在让每个人都能从中受益。AI搜索正是Gemini融入谷歌多项服务的重要一环，其具备的多步骤推理能力可以一次性处理带有多个限制条件的长问题，并支持“拍视频”搜索等创新搜索形式。

Gemini 1.5 Pro大模型以其长上下文窗口而闻名，谷歌宣布将在今年晚些时候将其100万Tokens的窗口进一步扩大至200万Tokens，这将极大地拓展其同步处理多模态信息的边界。为了满足不同场景的需求，谷歌还推出了适用于快速响应场景的Gemini 1.5 Flash模型。此外，谷歌还发布了多模态领域的多项创新成果，包括文生图工具Imagen 3、与YouTube和音乐家合作的“AI音乐沙盒”，以及最新的视频生成模型Veo。

值得关注的是，谷歌在发布会上也提到了实时AI助手功能。从今年夏天开始，Gemini将支持语音实时交互，并在今年晚些时候上线实时视频交互功能。此外，谷歌还将推出类似于GPTs的自定义AI助手功能Gems，它能够与谷歌的“全家桶”服务无缝对接，为用户提供更加个性化、智能化的服务。

在硬件方面，谷歌宣布了第六代TPU芯片Trillium，并透露将在明年初使用英伟达最新的Blackwell架构GPU。此外，液冷、光缆等技术也成为了发布会上的一大亮点。

谷歌的Gemini 1.5 Pro模型拥有长达200万token的上下文窗口，这在全球消费类聊天机器人中堪称最长。该模型将向150多个国家地区的Gemini Advanced订阅者提供，并支持超过35种语言。Pichai表示，Gemini 1.5 Pro为所有基础模型提供了迄今为止最长的上下文窗口，展现了谷歌在AI技术领域的领先地位和持续创新能力。

谷歌在AI技术领域的创新步伐持续加速，特别是在其最新发布的Gemini模型中，我们可以看到一系列令人瞩目的新功能和应用场景。以下是对这些新功能的详细介绍：

Gemini新语音对话功能Live：谷歌将在今年夏季扩展Gemini的多模态功能，引入名为“Live”的语音对话功能。这一功能将使用户能够通过语音与Gemini进行深入、双向的对话，选择各种自然的声音作为回应。更重要的是，用户可以按照自己的节奏进行对话，甚至在回答过程中打断并澄清问题，这种交互方式无疑将极大地提升用户体验，使AI对话更加接近自然的人类交流。
旅行规划功能：谷歌还将在Gemini Advanced中添加新的旅行规划功能。该功能将利用先进的推理能力，考虑时间和空间方面的物流因素，为用户创建个性化的行程，从而节省用户的工作时间。这一功能的推出，将使得Gemini不仅仅是一个智能助手，更是一个能够为用户提供全方位生活服务的智能伙伴。
数据分析功能：未来几周，谷歌将在Gemini Advanced中添加新的数据分析功能。用户只需上传电子表格，Gemini就可以分析数据、制作图表，并更快地发掘见解。这一功能的引入，将使得Gemini在处理复杂数据和提供决策支持方面展现出强大的能力，为用户的工作和学习带来极大的便利。
Gemini的定制版本Gem：谷歌将推出被称为Gem的Gemini的定制版本。Gemini Advanced订阅者将很快可以获得更个性化的体验，根据自己的需要创建Gemini。用户只需描述希望Gem做什么以及希望它如何响应，就可以让它化身健身伙伴、主厨帮手、编代码的拍档或者创意写作指南。这一功能的推出，将使得Gemini能够更好地满足不同用户的需求和偏好，提供更为贴心和个性化的服务。
Project Astra和安卓端侧Gemini的多模态功能：谷歌还官宣推出了新的多模态AI项目Project Astra，它可以为用户解释智能手机拍到的东西。通过这一项目，用户只需将手机摄像头对准某个物体，Gemini就可以识别它并回答相关问题。此外，谷歌还将为安卓端侧的Gemini Nano添加多模式功能，使得用户的手机可以通过文本、图像、声音和口语等多种方式理解世界。这一功能的引入将使得Gemini更加智能和灵活，能够为用户提供更为丰富和便捷的服务。

综上所述，谷歌在Gemini模型中引入的这些新功能和应用场景，不仅展示了其在AI技术领域的深厚实力和创新精神，也为我们描绘了一个更加智能、便捷和个性化的未来生活图景。随着这些新功能的不断推出和完善，我们有理由相信，谷歌将继续引领AI技术的发展潮流，为我们带来更多惊喜和便利。

谷歌在2024年的I/O开发者大会上展示了其在人工智能（AI）领域的重大进展和创新。以下是针对您所描述的全场发布会内容的详细回顾：

人工智能Gemini的广泛应用：谷歌CEO桑达尔·皮查伊表示，已有超过150万开发者正在使用谷歌的AI模型Gemini。他展示了该模型在搜索、图片、工作套件和安卓系统等多个方面的应用案例。
AI概览功能（AI Overviews）：谷歌宣布将在美国推出新功能“AI概览”，该功能能够直接总结搜索结果，并具备多步骤推理能力，以处理带有多个限制条件的长问题。
Gemini 1.5 Pro模型的发布：谷歌推出了最新版本的Gemini 1.5 Pro模型，支持100万tokens的上下文窗口，并向全球所有开发者开放。同时，谷歌还预览了支持200万tokens的模型，并表示其目标是实现“无限上下文”。
Gemini 1.5 Flash大模型：谷歌推出了兼具速度与效率、多模态推理能力以及长达100万tokens上下文窗口的Gemini 1.5 Flash模型。开发者将能够申请体验支持200万tokens的模型。
AI助手Project Astra：谷歌展示了名为“Astra”的AI助手项目，该助手能够理解动态且复杂的世界，接受教导，并自然、无延迟地进行交流。通过摄像头视频，它能够识别多种指令。
生成式AI工具：谷歌发布了一系列与图像、音乐、视频有关的生成式AI工具，包括文生图工具Imagen 3、与YouTube和音乐家合作的“AI音乐沙盒”，以及最新的视频生成模型Veo。
TPU芯片Trillium的发布：谷歌宣布了第六代TPU芯片Trillium，较上一代芯片的算力表现翻4.7倍。谷歌云还将在2025年初采用英伟达的最新Blackwell架构GPU。
AI超级计算机与液冷系统：谷歌介绍了自家的AI超级计算机，并通过液冷系统实现效能翻倍。谷歌部署液冷系统的数据中心已经达到1GW，并持续增长。
AI Overviews功能的详细介绍：谷歌搜索业务负责人Liz Reid具体介绍了AI Overviews功能，该功能使搜索引擎能够具备多步骤推理能力，并支持视频形式的提问。
办公套件Workspace的更新：谷歌将逐步推出总结、邮件Q&A以及智能回复等功能，以提升办公效率。
Gemini App的更新与功能扩展：从今年夏天开始，Gemini将支持语音实时交互，并在今年晚些时候上线实时视频交互功能。谷歌还将推出类似于GPTs的自定义AI助手功能Gems，该助手能够与谷歌的全套服务进行交互。
安卓系统的“三大突破”：安卓生态系统的负责人Sameer Samat讨论了今年安卓系统的三大突破，包括“画圈圈搜索”、Gemini手机AI助手以及在手机本地运行的AI。