付費限定20. 尝试让机器拥有声音
付費限定

20. 尝试让机器拥有声音

更新於 發佈於 閱讀時間約 26 分鐘


大家好,我是Hivan。

好久不见了,今天我们来讨论下如何让机器拥有声音。

回顾一下我们上一讲的内容,我们已经成功使用Whisper模型使得AI能够理解我们说的话。这为我们带来了很多应用,例如让AI代替我们收听播客并总结内容。然而,这只是单向的交流模式。现在,让我们探索更深入的可能性,让AI不仅仅能够“听懂”我们的话,而且通过ChatGPT回答我们的问题,并将所有内容合成语音,用声音与我们进行双向交互。

这就是我们本次探索的主题:让AI说话。我们将学习如何使用云端API进行语音合成(Text-To-Speech),同时也会介绍开源模型,使您能够在本地CPU上实现这一功能,让数据安全问题不再是困扰。

让我们一起,给机器赋予声音吧!

以行動支持創作者!付費即可解鎖
本篇內容共 10749 字、0 則留言,僅發佈於从零开始接触人工智能大模型你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
avatar-img
茶桁的沙龍
9會員
62內容數
从基础开始,再到Python,然后是CV、BI、NLP等相关技术。从头到尾详细的教授一边人工智能。
留言
avatar-img
留言分享你的想法!
茶桁的沙龍 的其他內容
Hi, 大家好。我是茶桁。 在之前的课程中,我们接触了AI进行文字回复,语音合成。 那么将这两个组合在一起,我们基本就可以制作一个智能的语音聊天机器人了。看过电影《Her》的同学都应该清楚,AI因为用了女神斯嘉丽.约翰逊的配音,吸引到了不少的观众。 不过, 我们怎么能就满足于此呢,从文字到音频
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
大家好,我是茶桁。 最近事情太多,这一节课更新的有些晚了。 首先我们先了解一下我们本节课讲要讲一些什么,我们之前介绍过 llama-index 和 LangChain,学习了将大语言模型和自己的知识库组合来解决问题的方法。这个方法中,我们不需要调整我们使用的模型,而是使用嵌入向量索引我们的数据,
Hi, 大家好。我是茶桁。 在之前的课程中,我们接触了AI进行文字回复,语音合成。 那么将这两个组合在一起,我们基本就可以制作一个智能的语音聊天机器人了。看过电影《Her》的同学都应该清楚,AI因为用了女神斯嘉丽.约翰逊的配音,吸引到了不少的观众。 不过, 我们怎么能就满足于此呢,从文字到音频
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
大家好,我是茶桁。 最近事情太多,这一节课更新的有些晚了。 首先我们先了解一下我们本节课讲要讲一些什么,我们之前介绍过 llama-index 和 LangChain,学习了将大语言模型和自己的知识库组合来解决问题的方法。这个方法中,我们不需要调整我们使用的模型,而是使用嵌入向量索引我们的数据,