您可能听说过 ChatGPT,也可能听说过 Google 的 Bard,但您可能没有听说过其背后的技术以及接下来会发生什么。这让我们想到了谷歌的 Gemini。

什么是Gemini?
Gemini 是 Google 的下一代基础模型。它是PaLM 2的延续,PaLM 2 是 Google 的 Bard 聊天机器人和其他最近宣布的功能背后的当前人工智能模型。Google Gemini 目前仍处于训练模式,预计一旦推出将成为 OpenAI 的 GPT 的主要竞争对手。
据谷歌称,Gemini 从一开始就被设计为多模式的,在连接工具和 API 方面非常高效,并为内存和调度等未来的进步做好了准备。谷歌在博客文章中表示,Gemini 已经具备了之前型号所缺乏的出色的多模式能力。
谷歌表示:“一旦我们彻底调整和测试 Gemini 的安全性,我们将提供不同的尺寸和功能,类似于 PaLM 2。”
因此,它可以部署在多种产品、应用程序和设备上,让每个人受益。”
在会议上,他们展示了 PaLM 2,这是一种最先进的语言模型,具有扩展的多语言、推理和编码功能。他接受过使用 100 多种语言的多语言材料的广泛培训。
PaLM 2 可以将成语、诗歌和谜语等微妙内容生成并翻译成多种语言。
Gemini 可能会推动谷歌的 AI 努力,并挑战先驱 OpenAI 的 ChatGPT。ChatGPT 主要用于基于文本的对话,而 Gemini 是多模式的,这意味着它可以响应文本和图像。一旦与谷歌搜索集成,它就有可能改变消费者与流行搜索引擎互动的方式。
尽管有关 Gemini 的更多细节尚未公布,但它可能会超越 ChatGPT 和 Bing AI,推动 Google 成为 AI 领域的领先者。
谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai) 在会议上指出:“在成为人工智能领域第一大公司七年之后,我们正处于一个令人兴奋的转折点。”
皮查伊表示,Gemini 目前正在酝酿之中,并采用多模式方法进行创建,其目标是提高效率,并为记忆和规划等未来进步打开大门。皮查伊表示,这对双胞胎已经表现出了以前版本所缺少的卓越的多模式功能,尽管它仍处于早期阶段。
谷歌通过 TPU(芯片)训练 Gemini。皮查伊表示,一旦 Gemini 得到优化并通过安全检查,它将提供一系列功能,但没有提及具体的发布日期。
皮查伊明确表示,谷歌所有的人工智能模型都将在图像等结果中包含水印和元数据,以防止错误信息的传播。
是什么让Gemini优于 Chat GPT和 BingAI?
Gemini有几个有趣的“多模式”特征。Gemini 与只能读取和生成文本的 ChatGPT 不同,它基于多模态范式,可以理解和生成文本、代码和图像。
通过这种更广泛的技能,可以创造许多机会。例如,Gemini 可用于创建新型人工智能聊天机器人,它可以理解文本和图像并对其做出反应。
然而,ChatGPT 和 Bing 都只提供基于文本的通信,Bing 提供了用于创建图像的单独链接,但缺乏对聊天中图像的支持。
Gemini 可以处理比 ChatGPT 更广泛的产品和应用程序。例如,它可用于更新谷歌搜索或创建使用人工智能的尖端虚拟助手。然而在BingAI 和 ChatGPT 中缺少这些功能。不过,ChatGPT 也提供了可以改善结果的插件。
Gemini 还拥有内存和调度等功能,允许开发超出 ChatGPT 能力的基于 AI 的应用程序。
结论
Google 的下一代语言模型 Gemini 展示了出色的多模式功能,使其比纯文本竞争对手 ChatGPT 更具适应性。
Gemini 为聊天机器人和人工智能应用程序创造了新的机会,使它们能够读取和生成文本、代码和图形。这些应用程序现在可以处理更广泛的活动。与同时支持图像和多模态交互的 Gemini 不同,ChatGPT 和 BingAI 只能进行基于文本的交互。
虽然有关 Gemini 的更多具体信息尚未公布,但很明显,谷歌致力于推进人工智能技术并保持其在该领域的领导地位。
在我们热切等待其正式发布的同时,我们期待看到 Gemini 的全部潜力及其所带来的创造性。