資料週週New
1
位追蹤者
追蹤
Hi, 目前是一個懵懵懂懂的資料科學家,喜歡看各式各樣有趣的資料科學、機器學習應用,期待可以分享所學的知識給同樣對資料科學應用有興趣的大家!
發佈內容
我的成就
由新到舊
NLP 系列-3:文字向量化 - word2vec
在自然語言處理領域中,佔據核心地位的就是文字向量化的技術。先前有介紹過了經典好用的 tfidf,這次想要介紹融入了神經網路模型為基礎的word2vec(Google 2013年論文),事不宜遲,就讓我們往下看看吧
2023-01-06
4
NLP 系列-2:文字向量化 - tfidf
文字資料該怎麼分析? 文字屬於非結構化資料,不像正常身高、體重、年紀等是直接的數值型結構化資料,無法直接在資料科學、機器學習中使用。 因此,需要將文字轉成數值才能進行後續處理,而此轉換又稱為向量化。
2023-01-02
6
NLP 系列:NLP (自然語言處理)是什麼?
文字、語言是生活中不可或缺的一部分,而隨著網路時代的開始,我們更多的活動轉往網路、手機中,而最常見的媒介就是文字(語言)了,不論是新聞、個人心得、心情分享、論文等等,都是透過文字來表達想法。而這麼多的內容,電腦是如何呈現出我們感興趣的內容呢?那首先就是需要讓電腦能夠去解讀、使用文字這種非結構化資料,
2023-01-01
4
vocus 勳章
NFT
了解
如何蒐集勳章