我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
語義角色標注 (SRL) 提供了每個詞在句子中角色的增強訊息提取,這些提取的訊息可以改善翻譯、摘要等自然語言處理任務 (NLP),一個能理解詞語語義角色的模型將提供更高質量的 NLP 輸出。
然而,選擇一條實施 NLP 任務的路徑變得具有挑戰性,SRL 也不例外,我們可以總結本章中要檢視的問題為四個描述所使用資源的參數:特定任務、通用用途、開發和自助服務:
- 特定任務:特定任務模型(例如基於 BERT 的模型)必須經過訓練才能執行 SRL,這意味著需要機器資源、數據管理、模型優化(超參數)以及人類專家級資源
- 通用用途:ChatGPT 也能執行特定任務,儘管它不是專門針對任務的模型,本章中的 ChatGPT 模型不需要為 SRL 進行訓練,它可能不如專門任務模型那麼精確,但對於大多數 SRL 任務來說,它具有成本效益且相對高效
- 開發:如果涉及 API 的開發,則會產生成本,例如,可能需要進行開發以創建自定義解決方案或自助服務
- 自助服務:透過使用自助服務或自訂解決方案所獲得的收益可能會證明成本的合理性,然而,在任何投資之前,必須先進行風險管理研究,以評估自訂解決方案的有效性,如果網路連線不穩定,像是 ChatGPT Plus 這樣的線上服務可能無法滿足需求,但對某些專案來說可能已經足夠