付費限定

20. 尝试让机器拥有声音

閱讀時間約 26 分鐘


大家好,我是Hivan。

好久不见了,今天我们来讨论下如何让机器拥有声音。

回顾一下我们上一讲的内容,我们已经成功使用Whisper模型使得AI能够理解我们说的话。这为我们带来了很多应用,例如让AI代替我们收听播客并总结内容。然而,这只是单向的交流模式。现在,让我们探索更深入的可能性,让AI不仅仅能够“听懂”我们的话,而且通过ChatGPT回答我们的问题,并将所有内容合成语音,用声音与我们进行双向交互。

这就是我们本次探索的主题:让AI说话。我们将学习如何使用云端API进行语音合成(Text-To-Speech),同时也会介绍开源模型,使您能够在本地CPU上实现这一功能,让数据安全问题不再是困扰。

让我们一起,给机器赋予声音吧!

Support the creator with action! Pay to unlock
本篇內容共 10749 字、0 則留言,僅發佈於从零开始接触人工智能大模型You currently cannot view the following content, possibly because you are not logged in or do not have permission to view the room.
9會員
62Content count
从基础开始,再到Python,然后是CV、BI、NLP等相关技术。从头到尾详细的教授一边人工智能。
留言0
查看全部
發表第一個留言支持創作者!
茶桁的沙龍 的其他內容
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
大家好,我是茶桁。 最近事情太多,这一节课更新的有些晚了。 首先我们先了解一下我们本节课讲要讲一些什么,我们之前介绍过 llama-index 和 LangChain,学习了将大语言模型和自己的知识库组合来解决问题的方法。这个方法中,我们不需要调整我们使用的模型,而是使用嵌入向量索引我们的数据,
Hi,大家好。我是茶桁。 在第 11 讲中,我向您介绍了如何将各种资料内容向量化,借助Llama-index建立索引,对我们自己的文本资料进行问答。在过去的3讲中,我们深入了解了如何使用Langchain。该工具可帮助我们整合AI对语言的理解和组织能力、外部各种资料或者SaaS的API,以及您自己
你好,我是茶桁。 在之前的两讲中,我们深入了解了 Langchain 的 LLMChain 核心功能,它可以帮助我们链式地调用一系列命令,包括直接调用 OpenAI 的 API、调用其他外部接口或自己实现的 Python 代码。但这只是完成一个小任务所需的调用序列。除了这些,LangChain
大家好,我是茶桁. 在上一节课中,我们学习了如何使用LangChain这个Python包链式调用OpenAI的API。通过链式调用,我们可以将需要多轮询问AI才能解决的问题封装起来,将需要多轮自然语言调用才能解决的问题变成一个函数调用。 然而,LangChain对我们的帮助远不止于此。最近,Ch
Hi, 大家好,我是茶桁。 OpenAI 的大语言模型提供了 Completion 和 Embedding 两个核心接口。 我们可以通过增加提示语(Prompt)历史记录来提高模型的回答准确性和自然性。还可以将 Embedding提前索引好存起来,以此做到让AI根据外部知识来回答问题, 在我们
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
大家好,我是茶桁。 最近事情太多,这一节课更新的有些晚了。 首先我们先了解一下我们本节课讲要讲一些什么,我们之前介绍过 llama-index 和 LangChain,学习了将大语言模型和自己的知识库组合来解决问题的方法。这个方法中,我们不需要调整我们使用的模型,而是使用嵌入向量索引我们的数据,
Hi,大家好。我是茶桁。 在第 11 讲中,我向您介绍了如何将各种资料内容向量化,借助Llama-index建立索引,对我们自己的文本资料进行问答。在过去的3讲中,我们深入了解了如何使用Langchain。该工具可帮助我们整合AI对语言的理解和组织能力、外部各种资料或者SaaS的API,以及您自己
你好,我是茶桁。 在之前的两讲中,我们深入了解了 Langchain 的 LLMChain 核心功能,它可以帮助我们链式地调用一系列命令,包括直接调用 OpenAI 的 API、调用其他外部接口或自己实现的 Python 代码。但这只是完成一个小任务所需的调用序列。除了这些,LangChain
大家好,我是茶桁. 在上一节课中,我们学习了如何使用LangChain这个Python包链式调用OpenAI的API。通过链式调用,我们可以将需要多轮询问AI才能解决的问题封装起来,将需要多轮自然语言调用才能解决的问题变成一个函数调用。 然而,LangChain对我们的帮助远不止于此。最近,Ch
Hi, 大家好,我是茶桁。 OpenAI 的大语言模型提供了 Completion 和 Embedding 两个核心接口。 我们可以通过增加提示语(Prompt)历史记录来提高模型的回答准确性和自然性。还可以将 Embedding提前索引好存起来,以此做到让AI根据外部知识来回答问题, 在我们
你可能也想看
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
可能包含敏感內容
在本週一播出的訂閱集數《EP.157 女生約跑的時候腦袋裡都在想什麼?》中,我們兩位順性別異性戀女主持人分享了這個觀點: 同樣都是生理需求,但男性約跑比女性約跑的困難度要來得高好幾倍,這不是因為女性沒有需求,而是因為各自需面對的「社會風險」落差極大的原因(意思是說男性也是有風險的,只是相較低)...
Thumbnail
【書院晨音】 老子在警醒我們世人面對得失寵辱都要處之泰然。 我們要懂得去御物,去領導統御外在的事物, 而不能讓外在的事物來領導統御我們的精神、我們的的心態。 _節錄 老子書 第13章 寵辱若驚 ∷∷∷∷∷∷∷∷∷ 人生不會因為得失榮辱就變得比較好, 你永遠是你, 能讓你更好的人,只有你自己,
Thumbnail
chatgpt說得一口好資料科學跟股票分析,我就來實際看看他會寫什麼出來
Thumbnail
基隆的都市傳說,沒有發生過事故的「林開郡洋樓」,卻成了當地人口中的鬼屋。這棟日治時期洋樓建築,自 1931 年興建至今已有 90 餘年,歷史相當悠久,更是基隆港邊最早的豪宅;年久失修又位於高架橋下,感覺就是風水不太好,給人一種晦暗的陰森感。
童年——約略是國小——曾天真地說過,只要給我腳踏車就能去任何想去的地方。學測後的今天,終於有這個可能去嘗試這個狂言了。 前一晚在instagram弄了個投票,打算一路沿著四方位的某一向前行一整天。原本還害怕著投票率會比雄中選舉還糟糕,想不到意外蠻多迴響的,但也因此不能背信了呢。 制約 山路 舊鐵橋
Thumbnail
#28 不忘欣賞著 眼神總能閃耀著好奇的彼此 再一次 為他/她感到著迷。
當下逐漸構建初對於烘焙咖啡的概念的同時,需要一起建立的是對於美味的看法,或者說是定義。 一開始嘗試麻辣鍋的人,大概對於怎麼有辦法把紅通通的辣油放進嘴裡這件事情存疑;對於喜歡吃麻辣鍋的人,可以在辣味之後品嘗出麻、香等其他味道,並對麻辣鍋湯底提出自己的看法。 這之間的差異就在於腦中對於麻辣鍋的資料建立,
Thumbnail
大家好,我是諮商心理師 Harris。最近我在奇想一個問題:如果平日我的心理諮商是一種精神分析治療,那在「微解封」(2021年7月13-26日)日子裡執的,會不會是一次「微精神分析治療」?是在開玩笑嗎?也許不,因為我突然想起書櫃裡一本買了近十年但從未閱讀的書──《微精神分析》
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
可能包含敏感內容
在本週一播出的訂閱集數《EP.157 女生約跑的時候腦袋裡都在想什麼?》中,我們兩位順性別異性戀女主持人分享了這個觀點: 同樣都是生理需求,但男性約跑比女性約跑的困難度要來得高好幾倍,這不是因為女性沒有需求,而是因為各自需面對的「社會風險」落差極大的原因(意思是說男性也是有風險的,只是相較低)...
Thumbnail
【書院晨音】 老子在警醒我們世人面對得失寵辱都要處之泰然。 我們要懂得去御物,去領導統御外在的事物, 而不能讓外在的事物來領導統御我們的精神、我們的的心態。 _節錄 老子書 第13章 寵辱若驚 ∷∷∷∷∷∷∷∷∷ 人生不會因為得失榮辱就變得比較好, 你永遠是你, 能讓你更好的人,只有你自己,
Thumbnail
chatgpt說得一口好資料科學跟股票分析,我就來實際看看他會寫什麼出來
Thumbnail
基隆的都市傳說,沒有發生過事故的「林開郡洋樓」,卻成了當地人口中的鬼屋。這棟日治時期洋樓建築,自 1931 年興建至今已有 90 餘年,歷史相當悠久,更是基隆港邊最早的豪宅;年久失修又位於高架橋下,感覺就是風水不太好,給人一種晦暗的陰森感。
童年——約略是國小——曾天真地說過,只要給我腳踏車就能去任何想去的地方。學測後的今天,終於有這個可能去嘗試這個狂言了。 前一晚在instagram弄了個投票,打算一路沿著四方位的某一向前行一整天。原本還害怕著投票率會比雄中選舉還糟糕,想不到意外蠻多迴響的,但也因此不能背信了呢。 制約 山路 舊鐵橋
Thumbnail
#28 不忘欣賞著 眼神總能閃耀著好奇的彼此 再一次 為他/她感到著迷。
當下逐漸構建初對於烘焙咖啡的概念的同時,需要一起建立的是對於美味的看法,或者說是定義。 一開始嘗試麻辣鍋的人,大概對於怎麼有辦法把紅通通的辣油放進嘴裡這件事情存疑;對於喜歡吃麻辣鍋的人,可以在辣味之後品嘗出麻、香等其他味道,並對麻辣鍋湯底提出自己的看法。 這之間的差異就在於腦中對於麻辣鍋的資料建立,
Thumbnail
大家好,我是諮商心理師 Harris。最近我在奇想一個問題:如果平日我的心理諮商是一種精神分析治療,那在「微解封」(2021年7月13-26日)日子裡執的,會不會是一次「微精神分析治療」?是在開玩笑嗎?也許不,因為我突然想起書櫃裡一本買了近十年但從未閱讀的書──《微精神分析》