付費限定

05 为文本分类

更新於 發佈於 閱讀時間約 24 分鐘

Hi, 我是茶桁。

在前一讲中,我们观察到大型模型的确表现出良好效果。在情感分析任务中,通过使用 OpenAI API 提供的 Embedding,我们得到的结果要比能在单个机器上运行的较小模型(如T5-base)要好得多。然而,我们之前所选择的问题确实有些过于简单。我们将5个不同的评分分成了正面、负面和中性,同时还排除了相对难以判断的"中性"评价,因此我们判断准确率的提高相对较容易实现。但是,如果我们想要准确预测具体的分数呢?这将是我们接下来需要探索的问题。

训练机器学习模型

一种最简单的方法是利用我们获得的文本 Embedding 向量。这次我们将不再直接使用向量之间的距离,而是采用传统的机器学习方法进行分类。这样做的原因在于,仅仅使用向量之间的距离无法最大化利用已标注好的分数信息。

以行動支持創作者!付費即可解鎖
本篇內容共 9922 字、0 則留言,僅發佈於从零开始接触人工智能大模型你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
留言
avatar-img
留言分享你的想法!
avatar-img
茶桁的沙龍
9會員
62內容數
从基础开始,再到Python,然后是CV、BI、NLP等相关技术。从头到尾详细的教授一边人工智能。
茶桁的沙龍的其他內容
2023/07/31
Hi, 大家好。我是茶桁。 在之前的课程中,我们接触了AI进行文字回复,语音合成。 那么将这两个组合在一起,我们基本就可以制作一个智能的语音聊天机器人了。看过电影《Her》的同学都应该清楚,AI因为用了女神斯嘉丽.约翰逊的配音,吸引到了不少的观众。 不过, 我们怎么能就满足于此呢,从文字到音频
Thumbnail
2023/07/31
Hi, 大家好。我是茶桁。 在之前的课程中,我们接触了AI进行文字回复,语音合成。 那么将这两个组合在一起,我们基本就可以制作一个智能的语音聊天机器人了。看过电影《Her》的同学都应该清楚,AI因为用了女神斯嘉丽.约翰逊的配音,吸引到了不少的观众。 不过, 我们怎么能就满足于此呢,从文字到音频
Thumbnail
2023/07/31
大家好,我是Hivan。 好久不见了,今天我们来讨论下如何让机器拥有声音。 回顾一下我们上一讲的内容,我们已经成功使用Whisper模型使得AI能够理解我们说的话。这为我们带来了很多应用,例如让AI代替我们收听播客并总结内容。然而,这只是单向的交流模式。现在,让我们探索更深入的可能性,让AI
Thumbnail
2023/07/31
大家好,我是Hivan。 好久不见了,今天我们来讨论下如何让机器拥有声音。 回顾一下我们上一讲的内容,我们已经成功使用Whisper模型使得AI能够理解我们说的话。这为我们带来了很多应用,例如让AI代替我们收听播客并总结内容。然而,这只是单向的交流模式。现在,让我们探索更深入的可能性,让AI
Thumbnail
2023/07/31
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
Thumbnail
2023/07/31
Hi,大家好,我是茶桁。 其实到第18章的时候,我们处理文本的内容就全部都结束了,从本节课开始,我们要开始学习如何处理音频和图像。 我不知道有没有人和我一样的习性,就是比起视频和音频文件来说,还是跟喜欢看文本文件。这其中最主要的一个原因就是因为文本内容我们可以准确定位,而对于文本内容的接收速度还
Thumbnail
看更多
你可能也想看
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空,一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮,突然發現幾家商場都又開始重新上架,價格也都回到正常水準,估計是官方又再補了一批貨,想都沒想就立刻下單! 同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷!
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
要檢查兩段長篇文字,內容是否雷同,長久以來困擾著大家,沒有好的嵌入模型,會耗費大量人力,需要對長篇文檔進行人工閱讀然後人工分類。本文除了展示如何能完美的解決這個痛點以外,也提供一些延伸應用思路,學習CP值很高。期待你能從本文取得許多新的應用思路與應用潛力!
Thumbnail
要檢查兩段長篇文字,內容是否雷同,長久以來困擾著大家,沒有好的嵌入模型,會耗費大量人力,需要對長篇文檔進行人工閱讀然後人工分類。本文除了展示如何能完美的解決這個痛點以外,也提供一些延伸應用思路,學習CP值很高。期待你能從本文取得許多新的應用思路與應用潛力!
Thumbnail
大家好,我是茶桁。 最近事情太多,这一节课更新的有些晚了。 首先我们先了解一下我们本节课讲要讲一些什么,我们之前介绍过 llama-index 和 LangChain,学习了将大语言模型和自己的知识库组合来解决问题的方法。这个方法中,我们不需要调整我们使用的模型,而是使用嵌入向量索引我们的数据,
Thumbnail
大家好,我是茶桁。 最近事情太多,这一节课更新的有些晚了。 首先我们先了解一下我们本节课讲要讲一些什么,我们之前介绍过 llama-index 和 LangChain,学习了将大语言模型和自己的知识库组合来解决问题的方法。这个方法中,我们不需要调整我们使用的模型,而是使用嵌入向量索引我们的数据,
Thumbnail
Hi, 大家好,我是茶桁。 直奔主题,我们来谈谈成本这件事。 大家应该都知道,ChatGPT对免费用户是有5美元的API调用额度的,说是这么说,可是那是以前,现在新注册的小伙伴应该都发现自己的API Key根本无法调用API,原因是这个免费额度似乎已经失效了。而我可以直接说,在我从第一节到第10
Thumbnail
Hi, 大家好,我是茶桁。 直奔主题,我们来谈谈成本这件事。 大家应该都知道,ChatGPT对免费用户是有5美元的API调用额度的,说是这么说,可是那是以前,现在新注册的小伙伴应该都发现自己的API Key根本无法调用API,原因是这个免费额度似乎已经失效了。而我可以直接说,在我从第一节到第10
Thumbnail
Hi,我是茶桁。 过去的8讲,你已熟悉Embedding和Completion接口。Embedding适合用于机器学习中的分类、聚类等传统场景。Completion接口可以用作聊天机器人,也可以用于文案撰写、文本摘要、机器翻译等工作。 然而,很多同学可能认为这与他们的日常工作无关。实际上,我们通
Thumbnail
Hi,我是茶桁。 过去的8讲,你已熟悉Embedding和Completion接口。Embedding适合用于机器学习中的分类、聚类等传统场景。Completion接口可以用作聊天机器人,也可以用于文案撰写、文本摘要、机器翻译等工作。 然而,很多同学可能认为这与他们的日常工作无关。实际上,我们通
Thumbnail
Hi, 我是茶桁。 我们已经介绍了 OpenAI 的主要接口。这是基础知识系列的最后一讲,我们将讨论 OpenAI GPT 系列模型的其他接口。你可能不会经常使用其中一些接口,但了解它们不会有任何坏处,说不定你会在某些需求中用到它们。 在这篇文章中,我们将一起探讨 OpenAI 为文本改写和内容
Thumbnail
Hi, 我是茶桁。 我们已经介绍了 OpenAI 的主要接口。这是基础知识系列的最后一讲,我们将讨论 OpenAI GPT 系列模型的其他接口。你可能不会经常使用其中一些接口,但了解它们不会有任何坏处,说不定你会在某些需求中用到它们。 在这篇文章中,我们将一起探讨 OpenAI 为文本改写和内容
Thumbnail
Hi, 我是茶桁。 在上一节中,我们介绍了如何使用最新的ChatGPT API,注册HuggingFace账户,并将我们的聊天机器人部署出去。在这个过程中,我们学习了实际的应用开发过程,使你对聊天机器人的开发有了充足的体验。在这一讲中,我们将探讨OpenAI的各种接口提供的能力,以更深入地了解这些
Thumbnail
Hi, 我是茶桁。 在上一节中,我们介绍了如何使用最新的ChatGPT API,注册HuggingFace账户,并将我们的聊天机器人部署出去。在这个过程中,我们学习了实际的应用开发过程,使你对聊天机器人的开发有了充足的体验。在这一讲中,我们将探讨OpenAI的各种接口提供的能力,以更深入地了解这些
Thumbnail
Hi,我是茶桁。 在过去的两讲中,我们已经使用 OpenAI 提供的 Embedding 接口完成了文本分类的功能。现在,我们回到 Completion 接口,这一讲将带你更深入地了解该接口的使用。除此之外,我们还将快速搭建一个有界面的聊天机器人,这将让你更好地理解 Completion 接口的应
Thumbnail
Hi,我是茶桁。 在过去的两讲中,我们已经使用 OpenAI 提供的 Embedding 接口完成了文本分类的功能。现在,我们回到 Completion 接口,这一讲将带你更深入地了解该接口的使用。除此之外,我们还将快速搭建一个有界面的聊天机器人,这将让你更好地理解 Completion 接口的应
Thumbnail
Hi, 我是茶桁。 在前一讲中,我们观察到大型模型的确表现出良好效果。在情感分析任务中,通过使用 OpenAI API 提供的 Embedding,我们得到的结果要比能在单个机器上运行的较小模型(如T5-base)要好得多。然而,我们之前所选择的问题确实有些过于简单。我们将5个不同的评分分成了正面
Thumbnail
Hi, 我是茶桁。 在前一讲中,我们观察到大型模型的确表现出良好效果。在情感分析任务中,通过使用 OpenAI API 提供的 Embedding,我们得到的结果要比能在单个机器上运行的较小模型(如T5-base)要好得多。然而,我们之前所选择的问题确实有些过于简单。我们将5个不同的评分分成了正面
Thumbnail
大家好,我是茶桁。 在前两节课中,我们一起体验了 OpenAI 提供的 GPT-3.5 系列模型的两个核心接口。一个是获取文本的 Embedding 向量,另一个是根据提示语生成补全的文本内容。通过这两种方法,我们可以在零样本或少样本的情况下进行情感分析任务。然而,你可能会有两个疑问。首先,Emb
Thumbnail
大家好,我是茶桁。 在前两节课中,我们一起体验了 OpenAI 提供的 GPT-3.5 系列模型的两个核心接口。一个是获取文本的 Embedding 向量,另一个是根据提示语生成补全的文本内容。通过这两种方法,我们可以在零样本或少样本的情况下进行情感分析任务。然而,你可能会有两个疑问。首先,Emb
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News