資料科學
#
資料科學
含有「資料科學」共 48 篇內容
全部內容
發佈日期由新至舊
【從吳軍的矽谷來信到自我提升:探索資料科學家的成長之路】
吳軍的矽谷來信專欄中分享了優秀電腦工程師需要達到的幾個階段性目標,十分有趣,於此記錄一下,並自我反思。 目標一:對電腦科學的本質有了解 目標二:對電腦科學每年的變化要掌握 目標三:對於電腦科學的工具要用得隨心所欲 目標四:對產品設計要有常識 目標五:對未知的問題要知道如何解決 目標六
2024-04-27
8
#
吳軍
#
矽谷來信
#
資料科學
『普林斯頓最熱門的電腦通識課』資料與資訊
「資料探勘」早在十幾年前唸書時就有耳聞,但資料科學倒是近五年來才知道有這門學科。就我的理解來說,資料探勘就是如何從大量資料中找出有用的資訊,而「資料科學」就是利用這些有用的資訊來做分析,從而達到預測的目的。
2024-03-27
0
#
資料探勘
#
資料科學
#
網路爬蟲
要解決問題,就別把年月日放在長條圖的橫軸了吧
離開學術環境,進入到產業界之後,最近最有體會的事情有兩個。 學界vs業界 第一點是在製作簡報,整理資料的時候,不需要書寫太多的論述與說明。第二點是在製作圖表的時候,往往看到很多橫軸為時間的圖,不論是by月、日或年,而且圖上的資料標籤相當多。 有關第一點我目前還在調適當中,如果我寫太多字,說明太
2024-03-24
7
#
工作所見所聞
#
南科
#
研究所
【圖論Graph】Part1:初探圖形與圖形演算法之應用
圖形演算法在資料處理上扮演重要角色。本文介紹圖形的歷史、定義、技術用途,以及為什麼我們要關心圖形演算法。文末還提及圖形演算法在機器學習領域的應用。下次將介紹更詳細的圖形演算法內容。
2024-02-21
3
#
學習
#
金融市場
#
圖形
『普林斯頓最熱門的電腦通識課』軟體總結
現代的計算機概論範圍也越來越廣了,從傳統的「硬體」、「軟體」到「通訊」及「資料」等;其中,通訊現在應該算獨立於計算機之外自成一派。而資料科學則在近十年「機習學習」或「深度學習」變成顯學後,受到高度重視。不想變成時代的眼淚,還請多努力,別輕易躺平。
2024-02-21
0
#
程式設計
#
軟體
#
通訊
Hermès愛馬仕 和 Coach蔻馳 的包包會差多少錢?Python 分析精品包包的品牌等級與價格分佈
精品包的品牌等級代表了品牌的歷史、設計風格以及定位,從最高端的奢侈品市場(Hermès, Chanel)到入門級奢華品牌,價格差距極大。本文探討了品牌等級的定義,品牌對價格的影響以及不同品牌等級的價格分佈和平均價格。
2024-01-18
0
#
品牌
#
包包
#
奢侈
2023 碩士班專題演講感想『資料科學於不同領域之應用』
當我答應這個邀約時,心中想著要不要挑戰新的題目,也順帶讓我可以把堆積以久的「資料科學」相關書籍看完。因此,在還有好幾個月打底的情況下,我就設定了這個主題「資料科學於不同領域之應用」,既然決定了就要做到,但這也讓我後續苦不堪言。
2023-12-09
2
#
演講
#
資料科學
#
機器學習
機器學習實用技巧:用多進程加速你的特徵工程
在數據科學和機器學習中,特徵工程是提高模型性能的關鍵步驟之一,通過創建新特徵或轉換現有特徵,我們可以更好地捕捉數據中的信息,提高模型的預測能力。然而,當處理大數據集時,特徵工程可能變得耗時,而且若是在研發階段,特徵其實是需要快速迭代去產生並且做後續的實驗,這也是近期遇到的問題,因此想在這篇文章實作多
2023-10-30
9
#
數據
#
學習
#
資料科學
生存報告_20231010
這2個月以來,專心於上職訓局的課程,擴展自己的技能樹,但不得不先暫停更新貓享想。現在結訓了,可以回歸重新耕耘,也開設新的專題「學享」,接下來從職訓期間的分享開始更新。
2023-10-10
3
#
職訓
#
AI
#
數據分析
特徵工程前的三大核心準備!
1. 問題定義 每一個成功的模型都始於明確的問題定義! 核心思考:你的模型想要達到什麼目的? 例如:是要偵測每一筆交易是否涉及洗錢,還是要從大量資料中找出可能的洗錢關聯戶? 2. 數據檢查 數據是模型的基石,但不是所有數據都是有用的! 核心思考:你的數據夠嗎?時間分佈如何?正負樣本
2023-10-09
7
#
數據
#
核心
#
模型