初探 BERT 的使用方式

更新於 2020/04/08發佈於 2020/04/08閱讀時間約 3 分鐘

最近因為武漢肺炎進行了一些奇怪的研究，見證了同事如何在短時間內建構出強大的 model 可以在論文海裡面找出一些很不錯的內容來回答一些專業的問題，決定開始抽出時間來努力嘗試駕馭這項強大的武器，BERT 問世其實已經一段時間了，自從 Google 在約莫兩年前放出這個模型之後在自然語言處理的領域造成了很大的漣漪效應，因為站在巨人肩膀上的這個基礎讓很多原本不容易做到堪用程度的自然語言處理任務一下子提升了一個檔次，主要應用在文本產生（text generation）、問題回答（question answering）以及跨語言的文意理解幾個領域，如果想要快速了解到底發生了什麼事情，非常推薦把以下李弘毅教授的兩個影片看完，可以先看第一個，如果沒有 transformer 的基礎再去看第二個補完：

經過一段時間的發展，基本上現在用 BERT 做出來的 model 都可以輕鬆的在各大自然語言處理任務的排行榜上屠殺四方，目前最成熟的套件之一當屬 Python 的 transformer，基本上把很多主流最強最猛的 model 都直接包進來了，可以非常無痛的直接上手使用，另外也包了 pipeline 可以非常快速的啟動簡單的任務，一開始看起來會覺得很龐雜，但使用起來是十分舒服的。

今天大概花了半小時的時間看了一下原始碼裡面 pipeline 是怎麼寫的，大致上對於question answering 的運作有個初步的概念，基本上就是先把問題映射到詞彙的輸入空間，然後去計算完輸出層的值之後去找到答案的頭跟尾，然後再映射回來對應的內容，中間注意力跟權重那些怎麼運作其實都可以不用管就可以用了，下面是一個 colab 的簡單範例，只需要 6 行程式碼就可以開始玩玩可以回答你任何奇怪問題的 AI，順手隨便找了一篇關於 Zoom 的文章問問看替代品是什麼，結果答案是 Skype hmm...

留言

留言分享你的想法！

Ofa Hsueh的沙龍

263會員

38內容數

本專題著重於探討資料分析實務，從實務經驗出發，探索學校所教導的建模以外的各項技術，包含資料前處理、營運整合與成效評估、團隊文化建構等等內容。

Ofa Hsueh的沙龍的其他內容

2021/10/17

在 M1 Mac 上連接 Android 手機進行USB tethering 網路分享

對數位遊牧的人來說網路分享的能源消耗在移動過程中是個需要留意的問題，自從換了 M1 的 Mac 之後，雖然電腦的續航力大增，但是因為沒辦法再使用 Android 手機進行網路分享，反而讓手機電力變成瓶頸，而且 wifi 基地台分享的方式產生的熱相當高，對手機也會有比較大的傷害

2021/10/17

在 M1 Mac 上連接 Android 手機進行USB tethering 網路分享

2021/04/26

面對低潮的三本好書

在人生旅途中，碰上失敗或是挫折的機會，往往比慶賀成功的派對來得高，大部分的時候我們的情緒肌肉可以應對日常的小挫折或是小失敗，但總有那麼幾次，也許是感情失敗，也許是職場失意，也許是與多年至交朋友之間的爭吵，一時的事件衝擊讓我們的情緒肌肉失去抵禦能力，進而讓我們不自覺就掉入的低潮的深淵

2021/04/26

面對低潮的三本好書

2021/01/27

HafH — 數位遊牧的旅居 pass

HafH (Home away from Home）是一個約兩年前在日本成立的新創公司，提供數位遊牧工作者在日本各地旅居工作的便利方案，去年因為疫情爆發使得遠距工作的需求大增，進而使得遊牧居住工作這種需求大幅增加，今年 HafH 也正式在台灣推出，更提供限時超級註冊與推薦優惠

2021/01/27

你可能也想看

本文介紹自我監督學習的概念和訓練方式，以BERT和GPT為例，深入探討Masking Input及Fine-Tune的實際操作和可應用性。

#機器學習#深度學習#ChatGPT

2024/05/16

dab戴伯的沙龍

BERT與GPT: 自監督學習的大型模型

本文介紹自我監督學習的概念和訓練方式，以BERT和GPT為例，深入探討Masking Input及Fine-Tune的實際操作和可應用性。

#機器學習#深度學習#ChatGPT

2024/05/16

孫正傑

ChatGPT 是什麼？

ChatGPT 是由 OpenAI 開發的一種人工智能語言模型，它基於 GPT-3.5 架構。GPT 的全名是 "Generative Pre-trained Transformer"，它是一種預訓練的自然語言處理模型。GPT-3.5 是 GPT 系列的最新版本，它在 GPT-3 的基礎上進行了改進

2023/08/05

2023/08/05

大家好，我是茶桁。在前两节课中，我们一起体验了 OpenAI 提供的 GPT-3.5 系列模型的两个核心接口。一个是获取文本的 Embedding 向量，另一个是根据提示语生成补全的文本内容。通过这两种方法，我们可以在零样本或少样本的情况下进行情感分析任务。然而，你可能会有两个疑问。首先，Emb

2023/07/31

2023/07/31

認識 ChatGPT：今年最熱門的 AI 工具

今年，一款名為 ChatGPT 的 AI 工具成為了極受關注的焦點。儘管其名聲大噪，仍有許多人對這個工具並不熟悉。那麼，這款工具究竟是什麼呢？讓我們一起來深入了解一下。

#ChatGPT

2023/06/22

AI筆者的沙龍

認識 ChatGPT：今年最熱門的 AI 工具

#ChatGPT

2023/06/22

Ted Chen的沙龍

對於大型語言模型的兩種不同期待

本文探討大型語言模型的兩種主要類型：GPT和BERT。GPT，如ChatGPT，被視為"通才"，能執行多種任務。BERT則被視為"專才"的基本語言模型。兩者各有優點：專才模型在特定任務上準確度高，而通才模型靈活多功能。選擇哪種取決於需求和目標。

2023/06/07

2023/06/07

ChatGPT 是什麼？ ChatGPT 的原理

這篇文章介紹了ChatGPT，一種大型的語言模型，能以自然語言回答問題，但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習，通過大量的網路資料進行訓練，讓模型能進行文字接龍。儘管GPT系列經歷了多次演進，並需用大量的訓練資料，它的問答能力仍有待提升。然而，透過不斷優化，我們已有了更進一步的版本

#ChatGPT#GPT技術#語言模型

2023/05/26

Ted Chen的沙龍

ChatGPT 是什麼？ ChatGPT 的原理

#ChatGPT#GPT技術#語言模型

2023/05/26

Ted Chen的沙龍

ChatGPT / GPT 學習記錄

在正式以比較技術面角度來認識 ChatGPT / GPT 之前，我們先用幾個簡單的例子來認識 ChatGPT 以及語言模型可以做到怎樣的事情。什麼是 ChatGPT？簡單來說明，ChatGPT 是一個背後使用 GPT 語言模型的對話機器人，而它可以做什麼事情了？我們先來使用幾個常見的語言相關的任

2023/04/28

2023/04/28

【ChatGPT系列】小學生也能聽懂！ChatGPT的技術、風險解析與使用說明

ChatGPT 是一款基於 GPT 技術的自然語言處理工具。那 GPT 是什麼呢？GPT 指的是 Generative Pre-trained Transformer，它是一種神經網絡模型，能夠處理自然語言的文本數據，學習文本之間的關聯，並且能夠根據這些關聯自動生成新的文本。ChatGPT 正是利用

#ChatGPT#觀點#AI

2023/04/04

【ChatGPT系列】小學生也能聽懂！ChatGPT的技術、風險解析與使用說明

#ChatGPT#觀點#AI

2023/04/04

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News