-
OpenAI 的 DevDay 为 AI 应用程序开发人员带来了实时 API
对于 OpenAI 来说这是动荡的一周,充满了 高管离职 和 主要筹款进展,但这家初创公司又卷土重来,试图说服…
-
构建本地语音助手:Whisper + Ollama + Bark
今天,我们更进一步,不仅实现了大型语言模型的对话功能,还添加了听力和口语功能。这个想法很简单:我们将创建一个语…
-
AudioLDM:彻底改变文本到音频的生成质量
AudioLDM 是音频嵌入和文本转音频生成领域的一项突破性生成式 AI 技术,它正在改变我们感知和与音频信号…
-
语音助手:让生活变得更轻松、更方便、更有趣
“小爱同学,播放 稻香”——整个房间都会充满你最喜欢的Jay Chou的专辑。 “嘿,小爱同学,我的手机在哪里…
-
NExT-GPT:任意到任意多模态LLM
NExT-GPT 是新加坡国立大学 NExT++ 实验室开发的多模态大型语言模型 (MM-LLM),并在题为“…
-
了解开源对话式 AI – Rasa
Rasa是一个开源的机器学习框架,用于自动化基于文本和语音的助理。构建真正帮助客户的上下文助理和聊天机器人很困…
-
对话式人工智能
什么是对话式人工智能? 对话式AI(对话式人工智能) 是一种 人工智能 使计算机能够理解、处理和生成人类语言。…
-
什么是LLM?大型语言模型及其工作原理指南
如果你正在阅读这篇文章,那么你可能已经听说过大型语言模型 (LLM)。谁没有听说过呢?归根结底,LLM 是推动…
-
CogVLM 在行业中的用例
CogVLM是一个大型多模态模型(LMM),你可以向其询问有关图像和文本的问题。例如,假设你打算识别机场停机坪…
-
NExT-GPT 端到端通用大型多模态任意语言模型 (MM-LLM)
多模态大型语言模型可以通过语音、文本和视觉输入实现用户和人工智能系统之间更自然、直观的通信,从而增强人机交互。…