分群

含有「分群」共 8 篇內容
全部內容
發佈日期由新至舊
付費限定
非監督式學習,是在沒有標準答案的情況下,協助我們整理資料本身的結構。它回答三個核心問題:哪些資料彼此相似、哪些特徵才是真正重要、哪些事件常常一起發生。 本文從「聚類分析」、「降維技術」到「關聯規則學習」,帶你建立非監督式學習的整體理解框架,理解 AI 如何先整理資料,再由人來解讀意義。
Thumbnail
非監督式學習(Unsupervised Learning)用來處理沒有答案的資料。它不依賴事先標記好的答案,而是透過觀察資料本身,找出相似性、隱藏關係與整體結構,幫助我們理解資料「長什麼樣子」。因此,非監督式學習常被用在資料探索、前處理與策略分析。當問題尚未被清楚定義時,它往往是第一個登場的工具。
Thumbnail
東西擺在眼前,卻沒人告訴你該怎麼分,這時候該怎麼辦? 有些情況,其實早就有「正確答案」等你套用; 但也有些時候,只能靠自己觀察規律、把相似的東西放在一起。 這篇文章用一個生活化的例子,帶你分清「分類」與「分群」到底差在哪,讓你在做決定時不再用錯方法。
Thumbnail
在資料分析中,分群分析(Cluster Analysis)是一種常見的無監督學習(Unsupervised Learning)方法,用來探索資料中的自然群集結構。當我們沒有標籤資料、也不知道該分成幾群時,分群分析能幫助我們發現潛在的分類邏輯。 在眾多分群方法中,階層式分群分析(Hierarchic
Thumbnail
題目會給我們一張資料表Queue,代表乘客排隊上車的情境。 裡面分別有person_id、 person_name 、weight、turn等欄位,分別代表乘客ID、乘客姓名、乘客重量、乘客排隊的順序。 要求我們判斷,在不超重的條件下,最後一位上車的乘客是誰。
Thumbnail
題目會給我們兩張資料表。 第一張是Customer資料表,裡面分別有customer_id 、product_key 等欄位。其中product_key 是這張資料表的外鍵foreign key,關連到第二張Product資料表。 題目還特別提醒,這張資料表可能包含重複的data row
Thumbnail
題目敘述 題目會給我們一張Courses資料表,裡面分別有student、class等欄位。其中(student, class) 是這張資料表的複合主鍵Primary key pair。 要求我們,以課程做分群,列出至少有五位同學的課程。 輸出的順序不拘。 Table: Courses
Thumbnail
題目敘述 題目會給我們一張Activity資料表,裡面分別有user_id、 session_id、activity_date 、activity_type等欄位。 要求我們列出所有過去30天的活躍使用者。 活躍使用者的定義為2019-07-27包含這天,往前三十天的區間內,至少有過一次活動紀錄
Thumbnail