我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
我們將使用搭載 GPT-4 的 ChatGPT Plus 來運行從簡單到複雜的範例,接著,我們會安裝 OpenAI 並向 GPT-4 解釋我們對模型的期望,我們會在 Google Colab 筆記本中運行基本到困難的語義角色標注 (SRL) 範例,最後,我們將通過運行複雜的 SRL 範例來挑戰 ChatGPT,我們將觀察一個通用的、漸進式模型如何回應我們的 SRL 請求,並逐步將 Transformer 模型推向 SRL 的極限,找到模型的極限是確保 Transformer 模型在現實生活中的實施保持現實和務實的最佳方法。
本章將涵蓋以下主題:
- 特定任務模型與通用模型(包括 SRL)的問題
- 自助服務與開發部署的問題
- 定義 SRL
- 定義 SRL 輸入的標準格式
- 在基本範例上測試句子標籤
- 在複雜範例上測試 SRL 並解釋結果
- 將 Transformer 模型運用到 SRL 的極限並描述這是如何完成的