數據科學

含有「數據科學」共 11 篇內容
全部內容
發佈日期由新至舊
在 2024 年,Python 超越 JavaScript 成為 GitHub 上最受歡迎的程式語言,這一趨勢受數據科學和機器學習需求的推動。同時,Jupyter Notebooks 使用量激增,顯示開發者對 Python 的依賴。
謝謝您的分享❤️
「物理學家費曼:"科學哲學對科學家的用處,跟鳥類學對鳥的用處一樣。"鳥不需要鳥類學指導,科學哲學也一樣無法指導科學。」 「量子力學告訴我們,規則不能決定所有事情。」 「物理理論都是一些臨時的模型。物理學並不是在探究真實世界的本質。物理學只是在試圖描寫世界的運行方式而已。」 「世界是
「直覺和生活常識非常有用,但缺乏知識的直覺會欺騙你。」 「Google對產品經理的要求是,在沒有數據之前不要輕易給出結論。」 「有些事情讓你放棄掉生活中獲得的直覺,是千難萬難。」 「有一點經驗的工程師都知道,任何產品的性能都有一個物理上無法突破的極限, 這個極限並不需要等到工
攻擊者的目的,是發展出一種方式, 能夠可靠辨認出特定的數據點, 是否包含於目前算法的訓練數據中, 以此來窺探算法的訓練數據隱私。 有另外一類的研究,叫做數據拷貝, 則是直接觀察算法的輸出, 看看算法輸出是否有過於靠近訓練數據的情形。 這種數據拷貝的觀察, 也轉成另一種成員推論攻擊的形式。
魔球記載MLB奧克蘭運動家隊的真實故事。該隊以小搏大,用數據思維選出一批從未被看好的球員,打出最瘋狂的佳績。 這本是經典老書了,書中細節大家已多有討論,我只著重在「統計數據」與「新舊觀念衝突」兩部分。透過魔球的精神,反思今天科技時代下「人」或「人才」的價值,我也會表達我對一個大趨勢形成的看法。
Thumbnail
你會在程式裡面寫函數嗎? 通常寫函數的第一個問題,就是要給函數取名字。 名字取得不好,後來調用函數不自然,就會拖垮整個寫程式的效率。 為函數命名,也是一門技術,好的函數命名,就能提高函數被重複使用的頻率。 然而,也是在某些情況下,我們需要「一次性函數」。 沒錯,用完即丟的函數。
Thumbnail
在機器學習中,我們的目標是找到一種能夠最好地描述數據的模型。例如,在迴歸問題中,我們希望找到一種函數,該函數能以一種對我們的目標變數(例如:銷售量、股票價格等) 的最佳估計的方式,描述輸入特徵(例如:廣告支出、市場狀況等)。
Thumbnail
本文回答幾個問題:(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
Thumbnail
最近為了系統性複習有關時間序列的知識,在Udemy上了一堂評價不錯的課程Python for Time Series Data Analysis。整體來說,我覺得課程是值得推薦初學者的。但因為課程對於很多時間序列的模型只是淺淺帶過,如果對時間序列已經有了解的人會比較像是浪費錢。
Thumbnail
付費限定
以前剖開表皮,見到橘子果肉就心滿意足。現在則是連纖維都不容錯過。
Thumbnail