付費限定

21. 尝试制作你自己的数字人进行播报

閱讀時間約 56 分鐘

Hi, 大家好。我是茶桁。

在之前的课程中,我们接触了AI进行文字回复,语音合成。

那么将这两个组合在一起,我们基本就可以制作一个智能的语音聊天机器人了。看过电影《Her》的同学都应该清楚,AI因为用了女神斯嘉丽.约翰逊的配音,吸引到了不少的观众。

不过, 我们怎么能就满足于此呢,从文字到音频,我们似乎还缺少了一点什么。是啊,谁不希望拥有一个特定的虚拟人来发出自己特定的语音。看着自己在镜头面前侃侃而谈的样子,是不是想想就兴奋?

把这些需求都结合在一起,那就是“数字人”了,我相信各位小伙伴或多或少都已经接触过,至少在抖音上看到过其他主播的“数字人”了。但是我们不得不说,那些都是一些商业公司的成熟方案,而咱们要实现的内容肯定比不了人家,但是作为概念演示,那是完全够用了。

以行動支持創作者!付費即可解鎖
本篇內容共 22740 字、0 則留言,僅發佈於从零开始接触人工智能大模型你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
9會員
62內容數
从基础开始,再到Python,然后是CV、BI、NLP等相关技术。从头到尾详细的教授一边人工智能。
留言0
查看全部
發表第一個留言支持創作者!
茶桁的沙龍 的其他內容
大家好,我是Hivan。 好久不见了,今天我们来讨论下如何让机器拥有声音。 回顾一下我们上一讲的内容,我们已经成功使用Whisper模型使得AI能够理解我们说的话。这为我们带来了很多应用,例如让AI代替我们收听播客并总结内容。然而,这只是单向的交流模式。现在,让我们探索更深入的可能性,让AI
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
大家好,我是茶桁。 最近事情太多,这一节课更新的有些晚了。 首先我们先了解一下我们本节课讲要讲一些什么,我们之前介绍过 llama-index 和 LangChain,学习了将大语言模型和自己的知识库组合来解决问题的方法。这个方法中,我们不需要调整我们使用的模型,而是使用嵌入向量索引我们的数据,
Hi,大家好。我是茶桁。 在第 11 讲中,我向您介绍了如何将各种资料内容向量化,借助Llama-index建立索引,对我们自己的文本资料进行问答。在过去的3讲中,我们深入了解了如何使用Langchain。该工具可帮助我们整合AI对语言的理解和组织能力、外部各种资料或者SaaS的API,以及您自己
你好,我是茶桁。 在之前的两讲中,我们深入了解了 Langchain 的 LLMChain 核心功能,它可以帮助我们链式地调用一系列命令,包括直接调用 OpenAI 的 API、调用其他外部接口或自己实现的 Python 代码。但这只是完成一个小任务所需的调用序列。除了这些,LangChain
大家好,我是茶桁. 在上一节课中,我们学习了如何使用LangChain这个Python包链式调用OpenAI的API。通过链式调用,我们可以将需要多轮询问AI才能解决的问题封装起来,将需要多轮自然语言调用才能解决的问题变成一个函数调用。 然而,LangChain对我们的帮助远不止于此。最近,Ch
大家好,我是Hivan。 好久不见了,今天我们来讨论下如何让机器拥有声音。 回顾一下我们上一讲的内容,我们已经成功使用Whisper模型使得AI能够理解我们说的话。这为我们带来了很多应用,例如让AI代替我们收听播客并总结内容。然而,这只是单向的交流模式。现在,让我们探索更深入的可能性,让AI
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
大家好,我是茶桁。 最近事情太多,这一节课更新的有些晚了。 首先我们先了解一下我们本节课讲要讲一些什么,我们之前介绍过 llama-index 和 LangChain,学习了将大语言模型和自己的知识库组合来解决问题的方法。这个方法中,我们不需要调整我们使用的模型,而是使用嵌入向量索引我们的数据,
Hi,大家好。我是茶桁。 在第 11 讲中,我向您介绍了如何将各种资料内容向量化,借助Llama-index建立索引,对我们自己的文本资料进行问答。在过去的3讲中,我们深入了解了如何使用Langchain。该工具可帮助我们整合AI对语言的理解和组织能力、外部各种资料或者SaaS的API,以及您自己
你好,我是茶桁。 在之前的两讲中,我们深入了解了 Langchain 的 LLMChain 核心功能,它可以帮助我们链式地调用一系列命令,包括直接调用 OpenAI 的 API、调用其他外部接口或自己实现的 Python 代码。但这只是完成一个小任务所需的调用序列。除了这些,LangChain
大家好,我是茶桁. 在上一节课中,我们学习了如何使用LangChain这个Python包链式调用OpenAI的API。通过链式调用,我们可以将需要多轮询问AI才能解决的问题封装起来,将需要多轮自然语言调用才能解决的问题变成一个函数调用。 然而,LangChain对我们的帮助远不止于此。最近,Ch
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
最近因為和幾位大學生一起上課,聽到他們在討論對於畢業的焦慮,有些人甚至才大一而已,就已經覺得對未來很徬徨,而讓我發現大學時的自己,真是超乎常理的樂觀。當時已經大四的我,其實也不是很確定方向,而且研究所推甄也沒有考上,但依然繼續實驗室以及補習班的打工、有空時再去打個球,那時候的我,竟然非常天真的以為…
Thumbnail
付出的時間被無形之中量化、努力的心血心心念念著回報,有趣的一切被數據化成投報率。 慢慢地,慢慢地,恐懼的感覺讓自己放棄了掙扎,我不再覺得新奇,只覺得與我無關,並給予禮貌的回應。
Thumbnail
把作品刻意定位在某個風格流派, 就會出現這樣「誤殺」的結果, 把好的作品打入十八層地獄。
Thumbnail
未料,過了半個月在周刊上看到對手陣營縣長被爆料系列報導的照片,除相關人士被跟拍的照片,縣長參選人及相關背景照竟是我提供給政治幕僚的。
不熟悉的事, 試著試著, 熟了 就熟了。 不熟 在嘗試。
Thumbnail
咖啡的烘焙度 烘焙咖啡的過程中,對於何時該下豆,每個烘豆師都有自己的看法,然而對於何時下豆的描述或是烘焙度的描述,則是烘焙者溝通飲用者的一種有效方式。 語言的作用是形成讓雙方可以溝通的平台,烘焙度的表示則基於烘焙者要表達該批烘焙咖啡豆的烘焙狀態而提出。 當然,這就要討論到烘焙度的描述基礎了,烘焙度的
Thumbnail
上星期看了《聽見歌  再唱》心中滿滿感動,而片尾也打出了一個關於包場另有優惠的促銷廣告,當下讓我聯想到先生服務學校的男女籃球隊和隊職員,也很適合觀看這部電影,於是徵求主管同意,打了專線電話詢問包場的相關費用及權益。
當所有人,選擇漠視的時候,以恩卻決定向前查看允福的狀況。 「你還好嗎?」 以恩說。 此時,允福感覺以恩像是一道光,來救自己的光。 「我是不是像他們說的一樣瘋了?」允福垂頭喪氣地問著以恩。 以恩卻不在乎所有同學的眼光,對著允福慢慢緩緩地說:「這沒有的事,你先不要多想了。」
Thumbnail
一年多前決定離開中壢到台北,與這座城市裡許多年輕人一樣,我蝸居在潮濕嘈雜的小套房,選擇了一個新的工作,薪水不多不少,工作熱情偶爾點燃,偶爾磨耗。23歲初入社會的我其實非常脆弱,25歲的我卻開始變老,現在終於來到面對27歲的關卡,重新學習放下抗拒,不再抗拒生命。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
最近因為和幾位大學生一起上課,聽到他們在討論對於畢業的焦慮,有些人甚至才大一而已,就已經覺得對未來很徬徨,而讓我發現大學時的自己,真是超乎常理的樂觀。當時已經大四的我,其實也不是很確定方向,而且研究所推甄也沒有考上,但依然繼續實驗室以及補習班的打工、有空時再去打個球,那時候的我,竟然非常天真的以為…
Thumbnail
付出的時間被無形之中量化、努力的心血心心念念著回報,有趣的一切被數據化成投報率。 慢慢地,慢慢地,恐懼的感覺讓自己放棄了掙扎,我不再覺得新奇,只覺得與我無關,並給予禮貌的回應。
Thumbnail
把作品刻意定位在某個風格流派, 就會出現這樣「誤殺」的結果, 把好的作品打入十八層地獄。
Thumbnail
未料,過了半個月在周刊上看到對手陣營縣長被爆料系列報導的照片,除相關人士被跟拍的照片,縣長參選人及相關背景照竟是我提供給政治幕僚的。
不熟悉的事, 試著試著, 熟了 就熟了。 不熟 在嘗試。
Thumbnail
咖啡的烘焙度 烘焙咖啡的過程中,對於何時該下豆,每個烘豆師都有自己的看法,然而對於何時下豆的描述或是烘焙度的描述,則是烘焙者溝通飲用者的一種有效方式。 語言的作用是形成讓雙方可以溝通的平台,烘焙度的表示則基於烘焙者要表達該批烘焙咖啡豆的烘焙狀態而提出。 當然,這就要討論到烘焙度的描述基礎了,烘焙度的
Thumbnail
上星期看了《聽見歌  再唱》心中滿滿感動,而片尾也打出了一個關於包場另有優惠的促銷廣告,當下讓我聯想到先生服務學校的男女籃球隊和隊職員,也很適合觀看這部電影,於是徵求主管同意,打了專線電話詢問包場的相關費用及權益。
當所有人,選擇漠視的時候,以恩卻決定向前查看允福的狀況。 「你還好嗎?」 以恩說。 此時,允福感覺以恩像是一道光,來救自己的光。 「我是不是像他們說的一樣瘋了?」允福垂頭喪氣地問著以恩。 以恩卻不在乎所有同學的眼光,對著允福慢慢緩緩地說:「這沒有的事,你先不要多想了。」
Thumbnail
一年多前決定離開中壢到台北,與這座城市裡許多年輕人一樣,我蝸居在潮濕嘈雜的小套房,選擇了一個新的工作,薪水不多不少,工作熱情偶爾點燃,偶爾磨耗。23歲初入社會的我其實非常脆弱,25歲的我卻開始變老,現在終於來到面對27歲的關卡,重新學習放下抗拒,不再抗拒生命。