我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。
Transformer模型驅動的人工智慧正在將無所不在的一切連接起來,機器直接與其他機器通訊,人工智慧驅動的物聯網訊號無需人工干預即可觸發自動決策。 自然語言處理演算法發送自動報告、摘要、電子郵件、廣告等。
人工智慧專家可以是人工智慧大師,提供設計想法、解釋和實現,以下提供幾個由淺入深的發展面向:
- ChatGPT / GPT-4 模型及其後繼者如何完成任務。例如,向模型展示要做什麼,涉及處理輸入的上下文,這項新任務被命名為Prompt Engineering。Prompt工程師是未來扮演AI溝通師的角色,關於這領域可以參考此頻道系列文章:AI說書 - Prompt Engineering - 0
- 具有語言學和自然語言處理技能的人工智慧專業人員可以處理資料集和輸出包裝,甚至朝向客製化AI模型發展。
- 有些 Hugging Face 功能需要開發,需要提供 API 和函式庫。然而,有時候,我們還是得親自動手。在這種情況下,訓練、微調模型和找到正確的超參數將需要人工智慧專家的專業知識。
- 在某些專案中,Tokenizer和資料集不符,或者模型的Embedding可能不適合此專案,在這種情況下,與語言學家合作的人工智慧開發人員可以發揮至關重要的作用,因此,計算語言學的訓練在這個層面上可以派上用場。