入門NLP思維

更新於 發佈於 閱讀時間約 4 分鐘

Google已經是現代人疑難雜症的好幫手,任何事情都能在網路上找到答案,對於入門NLP這件事也是,如果在GOOGLE搜尋”NLP入門”相關的關鍵字,檢索回來的結果大概可以分成兩種,一種是羅列各種NLP技能樹文章介紹,另一種則是介紹NLP書籍,不管是哪一種看到的都是彷彿學不完的知識,瞬間澆熄初學者想入門的熱情,主要原因是我們可以支配的空閑時間不夠用。

因為時間不夠,所以更要了解適合自己的入門方法

如果我們把學習量和可支配空閑時間兩個維度交叉來看如下圖,可以發現當要學習的知識量較大時需要更多時間來消化,通常是學生角色才比較符合這些條件,而一般朝九晚五上班族可支配空閑時間是相對大幅減少的,尤其是有家庭需要照顧的下班後幾乎沒有空閑時間,所以要將NLP技能樹全部點過一次是不切實際的。

raw-image

既然全部都學學不完,那就隨便選一項有興趣的技能來學吧?

選擇一項看起來有興趣的來切入學習或許也不失為一種好方法,我們常說AI是透過模仿人類的學習行為來學習新事物,在訓練AI模型的方法中,確實有一種就是回饋式學習,具體作法是一開始會讓模型胡亂預測,再由預測結果正確與否回饋給模型,藉由回饋修正模型預測規則來提升準確率,當練習的資料量夠多,模型就能夠收斂到一定的準度。

回到選擇學習技能這件事上,或許我們也能借鏡AI學習法,選擇一項子領域深入研究,在練習過程中自然會遇到需要解決的問題或他人回饋而習得額外的知識,最終提升到能夠在該領域獨立解決問題的能力。

還有其他的選擇方向嗎?

除了選擇一樣有興趣的子領域來學,還有方向可以更簡單的入門嗎,我想可以從學NLP的目的來得到解答,一般來說學習一個技能不外乎是想要用來解決工作上或生活上其他問題,因此如果在練習過程中就能夠學到最有價值、廣泛實用的知識,就不用繞遠路也能夠持續保有熱情學習。

因此我們可以把選擇技能問題轉化為優先學習泛用性高的技能就可以做到現學現賣,除了強化NLP跨領域知識,也能立即提升工作上的生產力。

如果要說明NLP領域廣泛實用的技能,那我想第一個應該是爬蟲,再來是資料探索,最後是語言模型。

資料爬蟲

如果AI模型是身體,那資料應該是身體裡的血液,沒有了血液身體也無法運作,所以一般在入門AI領域時,最先學習的就是資料檢索也就是爬蟲。尤其在資訊爆炸的世代裡,能夠用有邏輯、自動化方式擷取出我們想要的資料是很重要的事情,不僅限文本的爬蟲,包括圖片、影音都是。

資料探索

資料探索是一種透過資料整理方式來認識資料本身的過程,具體的手段有統計、資料視覺化檢視資料分佈,並實際檢查資料內容,釐清問題本身可否透過資料來得到解答,有利於後續的資料分析和建模,但因為過程冗長經常被跳過,不過卻是建模前的重要前哨站。

模型常被當作黑盒子存在且無法解釋預測結果,也比較難以除錯,而資料探索能夠得到更貼近生活語言的解釋,在一些場域中可解釋知識甚至價值更高,像是醫療領域,因為無法解釋的預測不只醫生不敢採納,病人也不會相信。

練習資料探索技巧除了能以各種角度了解資料各種變數關聯之外,學習透過資料來解惑其他人的問題也更有說服力。

語言建模

語言模型子領域有非常多種,在入門中可以從比較簡單常用的應用下手,像是文本分類、輿情分析、文本自動摘要、關鍵字擷取任務。

在具體操作上可以從使用開源軟體並選擇非深度學習模型入門,這個階段是體驗模型實際運用流程,了解資料輸入格式和模型輸出格式,所以可以先以範例文本訓練,並觀察實際輸出的內容是否接近預期的結果,再將訓練資料替換成實際的訓練資料重新訓練,再觀察一次輸出結果是否接近問題的答案。

通常沒有精調的模型準確度會偏低,後續就需要了解演算法內容,並調整合理的參數讓模型更好的學習直到收斂。

NLP領域雖然有看似學不完的技術,但只要根據適合自己的準則來拆解,就能找到能夠持續往前推進的道路,希望這篇能讓你有不一樣的思維方式來踏入NLP。

留言
avatar-img
留言分享你的想法!
avatar-img
7J的沙龍
3會員
3內容數
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
既然決定參加職訓,就要能夠「對症下藥」,找最接近我想做的領域來上,因此當初直接以「數據分析」、「資料科學」等關鍵字搜尋,最後選擇了結合現今正行的AI相關課程。本篇將以課程為主題,分享職訓的感想。
Thumbnail
既然決定參加職訓,就要能夠「對症下藥」,找最接近我想做的領域來上,因此當初直接以「數據分析」、「資料科學」等關鍵字搜尋,最後選擇了結合現今正行的AI相關課程。本篇將以課程為主題,分享職訓的感想。
Thumbnail
人工智慧(AI)是地球數字時代的重要一環,它塑造著我們的未來。如果您對AI充滿好奇,但不知道從何開始,這篇入門指南將為您提供一個堅實的基礎,幫助您踏上學習AI的旅程。 什麼是機器學習和深度學習? 機器學習是人工智能的一個子領域,它使機器能夠自動學習並提高其性能,而無需顯式編程。這意味著機器可以通
Thumbnail
人工智慧(AI)是地球數字時代的重要一環,它塑造著我們的未來。如果您對AI充滿好奇,但不知道從何開始,這篇入門指南將為您提供一個堅實的基礎,幫助您踏上學習AI的旅程。 什麼是機器學習和深度學習? 機器學習是人工智能的一個子領域,它使機器能夠自動學習並提高其性能,而無需顯式編程。這意味著機器可以通
Thumbnail
學習像拼圖,像出遊,像畫圖,像蜘蛛網 今天想整理我讀了五本書的心得: 高手學習、深度學習的技術、大腦喜歡這樣學、超速學習、躍遷 來討論學習這件事
Thumbnail
學習像拼圖,像出遊,像畫圖,像蜘蛛網 今天想整理我讀了五本書的心得: 高手學習、深度學習的技術、大腦喜歡這樣學、超速學習、躍遷 來討論學習這件事
Thumbnail
前言 文章內容皆來自「NLP超強溝通術」這本書籍的讀後心得,吸收、內化後透過作者自己的理解進行整理與輸出。 什麼是NLP? 其實就很像我們的電腦程式一般,以眼睛、鼻子接收輸入(N),藉由經驗化為程式並透過思考判斷產生出決策的過程(P),透過語言或肢體進行輸出(L),這就是NLP的基本運作模式。
Thumbnail
前言 文章內容皆來自「NLP超強溝通術」這本書籍的讀後心得,吸收、內化後透過作者自己的理解進行整理與輸出。 什麼是NLP? 其實就很像我們的電腦程式一般,以眼睛、鼻子接收輸入(N),藉由經驗化為程式並透過思考判斷產生出決策的過程(P),透過語言或肢體進行輸出(L),這就是NLP的基本運作模式。
Thumbnail
因為時間不夠,所以更要了解適合自己的入門方法 既然全部都學學不完,那就隨便選一項有興趣的技能來學吧? 在選擇學習技能這件事上,或許我們也能借鏡AI學習法,選擇一項子領域深入研究,在練習過程中自然會遇到需要解決的問題或他人回饋而習得額外的知識,最終提升到能夠在該領域獨立解決問題的能力...
Thumbnail
因為時間不夠,所以更要了解適合自己的入門方法 既然全部都學學不完,那就隨便選一項有興趣的技能來學吧? 在選擇學習技能這件事上,或許我們也能借鏡AI學習法,選擇一項子領域深入研究,在練習過程中自然會遇到需要解決的問題或他人回饋而習得額外的知識,最終提升到能夠在該領域獨立解決問題的能力...
Thumbnail
不論您想要種下的是什麼?它都需要時間去發芽、去吸收陽光、空氣和水來茁壯成長,所以大家一定要了解【思考無法速成】,光只是閱讀文章是不夠的,還需要您花時間親身持續的去練習和運用…
Thumbnail
不論您想要種下的是什麼?它都需要時間去發芽、去吸收陽光、空氣和水來茁壯成長,所以大家一定要了解【思考無法速成】,光只是閱讀文章是不夠的,還需要您花時間親身持續的去練習和運用…
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News