初探 BERT 的使用方式

更新於 發佈於 閱讀時間約 3 分鐘
感覺把 BERT tune 到可以弄成 BB-8 或是哈囉應該會蠻不錯的

感覺把 BERT tune 到可以弄成 BB-8 或是哈囉應該會蠻不錯的

最近因為武漢肺炎進行了一些奇怪的研究,見證了同事如何在短時間內建構出強大的 model 可以在論文海裡面找出一些很不錯的內容來回答一些專業的問題,決定開始抽出時間來努力嘗試駕馭這項強大的武器,BERT 問世其實已經一段時間了,自從 Google 在約莫兩年前放出這個模型之後在自然語言處理的領域造成了很大的漣漪效應,因為站在巨人肩膀上的這個基礎讓很多原本不容易做到堪用程度的自然語言處理任務一下子提升了一個檔次,主要應用在文本產生(text generation)、問題回答(question answering)以及跨語言的文意理解幾個領域,如果想要快速了解到底發生了什麼事情,非常推薦把以下李弘毅教授的兩個影片看完,可以先看第一個,如果沒有 transformer 的基礎再去看第二個補完:

經過一段時間的發展,基本上現在用 BERT 做出來的 model 都可以輕鬆的在各大自然語言處理任務的排行榜上屠殺四方,目前最成熟的套件之一當屬 Python 的 transformer,基本上把很多主流最強最猛的 model 都直接包進來了,可以非常無痛的直接上手使用,另外也包了 pipeline 可以非常快速的啟動簡單的任務,一開始看起來會覺得很龐雜,但使用起來是十分舒服的。

今天大概花了半小時的時間看了一下原始碼裡面 pipeline 是怎麼寫的,大致上對於question answering 的運作有個初步的概念,基本上就是先把問題映射到詞彙的輸入空間,然後去計算完輸出層的值之後去找到答案的頭跟尾,然後再映射回來對應的內容,中間注意力跟權重那些怎麼運作其實都可以不用管就可以用了,下面是一個 colab 的簡單範例,只需要 6 行程式碼就可以開始玩玩可以回答你任何奇怪問題的 AI,順手隨便找了一篇關於 Zoom 的文章問問看替代品是什麼,結果答案是 Skype hmm...


留言
avatar-img
留言分享你的想法!
avatar-img
Ofa Hsueh的沙龍
263會員
38內容數
本專題著重於探討資料分析實務,從實務經驗出發,探索學校所教導的建模以外的各項技術,包含資料前處理、營運整合與成效評估、團隊文化建構等等內容。
Ofa Hsueh的沙龍的其他內容
2021/10/17
對數位遊牧的人來說網路分享的能源消耗在移動過程中是個需要留意的問題,自從換了 M1 的 Mac 之後,雖然電腦的續航力大增,但是因為沒辦法再使用 Android 手機進行網路分享,反而讓手機電力變成瓶頸,而且 wifi 基地台分享的方式產生的熱相當高,對手機也會有比較大的傷害
Thumbnail
2021/10/17
對數位遊牧的人來說網路分享的能源消耗在移動過程中是個需要留意的問題,自從換了 M1 的 Mac 之後,雖然電腦的續航力大增,但是因為沒辦法再使用 Android 手機進行網路分享,反而讓手機電力變成瓶頸,而且 wifi 基地台分享的方式產生的熱相當高,對手機也會有比較大的傷害
Thumbnail
2021/04/26
在人生旅途中,碰上失敗或是挫折的機會,往往比慶賀成功的派對來得高,大部分的時候我們的情緒肌肉可以應對日常的小挫折或是小失敗,但總有那麼幾次,也許是感情失敗,也許是職場失意,也許是與多年至交朋友之間的爭吵,一時的事件衝擊讓我們的情緒肌肉失去抵禦能力,進而讓我們不自覺就掉入的低潮的深淵
Thumbnail
2021/04/26
在人生旅途中,碰上失敗或是挫折的機會,往往比慶賀成功的派對來得高,大部分的時候我們的情緒肌肉可以應對日常的小挫折或是小失敗,但總有那麼幾次,也許是感情失敗,也許是職場失意,也許是與多年至交朋友之間的爭吵,一時的事件衝擊讓我們的情緒肌肉失去抵禦能力,進而讓我們不自覺就掉入的低潮的深淵
Thumbnail
2021/01/27
HafH (Home away from Home)是一個約兩年前在日本成立的新創公司,提供數位遊牧工作者在日本各地旅居工作的便利方案,去年因為疫情爆發使得遠距工作的需求大增,進而使得遊牧居住工作這種需求大幅增加,今年 HafH 也正式在台灣推出,更提供限時超級註冊與推薦優惠
Thumbnail
2021/01/27
HafH (Home away from Home)是一個約兩年前在日本成立的新創公司,提供數位遊牧工作者在日本各地旅居工作的便利方案,去年因為疫情爆發使得遠距工作的需求大增,進而使得遊牧居住工作這種需求大幅增加,今年 HafH 也正式在台灣推出,更提供限時超級註冊與推薦優惠
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
本文介紹自我監督學習的概念和訓練方式,以BERT和GPT為例,深入探討Masking Input及Fine-Tune的實際操作和可應用性。
Thumbnail
本文介紹自我監督學習的概念和訓練方式,以BERT和GPT為例,深入探討Masking Input及Fine-Tune的實際操作和可應用性。
Thumbnail
ChatGPT 是由 OpenAI 開發的一種人工智能語言模型,它基於 GPT-3.5 架構。GPT 的全名是 "Generative Pre-trained Transformer",它是一種預訓練的自然語言處理模型。GPT-3.5 是 GPT 系列的最新版本,它在 GPT-3 的基礎上進行了改進
Thumbnail
ChatGPT 是由 OpenAI 開發的一種人工智能語言模型,它基於 GPT-3.5 架構。GPT 的全名是 "Generative Pre-trained Transformer",它是一種預訓練的自然語言處理模型。GPT-3.5 是 GPT 系列的最新版本,它在 GPT-3 的基礎上進行了改進
Thumbnail
大家好,我是茶桁。 在前两节课中,我们一起体验了 OpenAI 提供的 GPT-3.5 系列模型的两个核心接口。一个是获取文本的 Embedding 向量,另一个是根据提示语生成补全的文本内容。通过这两种方法,我们可以在零样本或少样本的情况下进行情感分析任务。然而,你可能会有两个疑问。首先,Emb
Thumbnail
大家好,我是茶桁。 在前两节课中,我们一起体验了 OpenAI 提供的 GPT-3.5 系列模型的两个核心接口。一个是获取文本的 Embedding 向量,另一个是根据提示语生成补全的文本内容。通过这两种方法,我们可以在零样本或少样本的情况下进行情感分析任务。然而,你可能会有两个疑问。首先,Emb
Thumbnail
今年,一款名為 ChatGPT 的 AI 工具成為了極受關注的焦點。儘管其名聲大噪,仍有許多人對這個工具並不熟悉。那麼,這款工具究竟是什麼呢?讓我們一起來深入了解一下。
Thumbnail
今年,一款名為 ChatGPT 的 AI 工具成為了極受關注的焦點。儘管其名聲大噪,仍有許多人對這個工具並不熟悉。那麼,這款工具究竟是什麼呢?讓我們一起來深入了解一下。
Thumbnail
本文探討大型語言模型的兩種主要類型:GPT和BERT。GPT,如ChatGPT,被視為"通才",能執行多種任務。BERT則被視為"專才"的基本語言模型。兩者各有優點:專才模型在特定任務上準確度高,而通才模型靈活多功能。選擇哪種取決於需求和目標。
Thumbnail
本文探討大型語言模型的兩種主要類型:GPT和BERT。GPT,如ChatGPT,被視為"通才",能執行多種任務。BERT則被視為"專才"的基本語言模型。兩者各有優點:專才模型在特定任務上準確度高,而通才模型靈活多功能。選擇哪種取決於需求和目標。
Thumbnail
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
Thumbnail
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
Thumbnail
在正式以比較技術面角度來認識 ChatGPT / GPT 之前,我們先用幾個簡單的例子來認識 ChatGPT 以及語言模型可以做到怎樣的事情。 什麼是 ChatGPT? 簡單來說明,ChatGPT 是一個背後使用 GPT 語言模型的對話機器人,而它可以做什麼事情了?我們先來使用幾個常見的語言相關的任
Thumbnail
在正式以比較技術面角度來認識 ChatGPT / GPT 之前,我們先用幾個簡單的例子來認識 ChatGPT 以及語言模型可以做到怎樣的事情。 什麼是 ChatGPT? 簡單來說明,ChatGPT 是一個背後使用 GPT 語言模型的對話機器人,而它可以做什麼事情了?我們先來使用幾個常見的語言相關的任
Thumbnail
ChatGPT 是一款基於 GPT 技術的自然語言處理工具。那 GPT 是什麼呢?GPT 指的是 Generative Pre-trained Transformer,它是一種神經網絡模型,能夠處理自然語言的文本數據,學習文本之間的關聯,並且能夠根據這些關聯自動生成新的文本。ChatGPT 正是利用
Thumbnail
ChatGPT 是一款基於 GPT 技術的自然語言處理工具。那 GPT 是什麼呢?GPT 指的是 Generative Pre-trained Transformer,它是一種神經網絡模型,能夠處理自然語言的文本數據,學習文本之間的關聯,並且能夠根據這些關聯自動生成新的文本。ChatGPT 正是利用
Thumbnail
Google 官方今日發布了一支影片,說明了近期Google 搜尋的發展近況。影片中很大部分與BERT 有關,BERT 厲害的地方是語意分析,能分析網頁是一篇食譜文章,還是一篇食記,另外搭配分析使用者前後的關鍵字來判斷搜尋意圖,來改善搜尋結果。
Thumbnail
Google 官方今日發布了一支影片,說明了近期Google 搜尋的發展近況。影片中很大部分與BERT 有關,BERT 厲害的地方是語意分析,能分析網頁是一篇食譜文章,還是一篇食記,另外搭配分析使用者前後的關鍵字來判斷搜尋意圖,來改善搜尋結果。
Thumbnail
最近因為武漢肺炎進行了一些奇怪的研究,見證了同事如何在短時間內建構出強大的 model 可以在論文海裡面找出一些很不錯的內容來回答一些專業的問題,決定開始抽出時間來努力嘗試駕馭這項強大的武器
Thumbnail
最近因為武漢肺炎進行了一些奇怪的研究,見證了同事如何在短時間內建構出強大的 model 可以在論文海裡面找出一些很不錯的內容來回答一些專業的問題,決定開始抽出時間來努力嘗試駕馭這項強大的武器
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News