資料週週New
1
位追蹤者
追蹤
Hi, 目前是一個懵懵懂懂的資料科學家,喜歡看各式各樣有趣的資料科學、機器學習應用,期待可以分享所學的知識給同樣對資料科學應用有興趣的大家!
資料週週New的沙龍
1
會員
3
內容數
加入
前往沙龍
喜歡資料科學的朋友應該都有聽過 NLP(自然語言處理)的大名,日常生活的Gmail、Google Search、Spotify等等應用都有使用這個技術。希望透過這個系列與大家稍微分享一下我個人對於 NLP 的看法,讓我們一起探索這個有趣、迷人的領域吧!
加入
前往沙龍
發佈內容
我的成就
全部內容
由新到舊
資料週週New的沙龍
2023/01/06
NLP 系列-3:文字向量化 - word2vec
在自然語言處理領域中,佔據核心地位的就是文字向量化的技術。先前有介紹過了經典好用的 tfidf,這次想要介紹融入了神經網路模型為基礎的word2vec(Google 2013年論文),事不宜遲,就讓我們往下看看吧
#
論文
#
NLP
#
資料科學
4
留言
資料週週New的沙龍
2023/01/02
NLP 系列-2:文字向量化 - tfidf
文字資料該怎麼分析? 文字屬於非結構化資料,不像正常身高、體重、年紀等是直接的數值型結構化資料,無法直接在資料科學、機器學習中使用。 因此,需要將文字轉成數值才能進行後續處理,而此轉換又稱為向量化。
#
tfidf
#
資料科學
#
NLP
6
留言
資料週週New的沙龍
2023/01/01
NLP 系列:NLP (自然語言處理)是什麼?
文字、語言是生活中不可或缺的一部分,而隨著網路時代的開始,我們更多的活動轉往網路、手機中,而最常見的媒介就是文字(語言)了,不論是新聞、個人心得、心情分享、論文等等,都是透過文字來表達想法。而這麼多的內容,電腦是如何呈現出我們感興趣的內容呢?那首先就是需要讓電腦能夠去解讀、使用文字這種非結構化資料,
#
自然語言處理
#
NLP
#
資料科學
4
留言
vocus 勳章
NFT
了解
如何蒐集勳章