資料科學 (25)

多階段連續製程預測
最後更新:
作品集, 資料科學, 機器學習, 監督式學習
一個多階段連續製程的工廠產線資料集,本實驗透過原料數據與機台參數預測產品輸出規格。

主成分分析 (Principal Component Analysis, PCA)
最後更新:
數學, 資料科學, 機器學習, 非監督式學習
主成分分析 (Principal Component Analysis, PCA) 是多變量分析中的經典方法,是一種基於正交轉換 (orthogonal transformation) 的技術,在盡可能保留資料特徵的前提下降低維度,常用於資料視覺化與處理共線性問題。

蘋果品質二元分類機器學習
最後更新:
資料科學, 機器學習, 作品集, 監督式學習, R 語言
來自 kaggle 上的蘋果品質資料集,資料集簡單易理解,適合作為類別型變數練習用的資料集。

客戶個性建模與評估
最後更新:
數學, 資料科學, 機器學習, 作品集, 合作作品, R 語言
本研究將對客戶個性進行建模,處理財務資料中常見的高共線性與異常值問題,引入穩健性羅吉斯回歸分析,預測客戶是否會參與活動。根據預測目標資料的不平衡,放棄了常用的準確率指標,開發基於利潤的模型評估指標,以達到利潤最大化做為模型選擇。最後根據變數的主成分選擇,並分析與探討該項活動背後市場的定位以及找出潛在客戶的特徵。

黃文璋教授之心在南方之文字探勘
資料科學, 資料視覺化, Latent Dirichlet Allocation (LDA), 人生, 心得, 研究, 作品集, 網路爬蟲
哀悼統計界的大家長文璋教授辭世,幸虧教授生前熱愛寫作,以統計觀點為其研究的文字探勘研究。

Labeled Latent Dirichlet Allocation (LLDA)
最後更新:
數學, 資料科學, 機器學習, 文字探勘, 監督式學習, Latent Dirichlet Allocation (LDA)
Latent Dirichlet Allocation (LDA) 的後續模型,一種可以用於文本的監督式機器學習模型。

邏輯回歸羅吉斯迴歸分析 (Logistic Regression)
最後更新:
數學, 資料科學, 機器學習, 監督式學習
一種廣義線性模型,能用於預測類別型變數

Latent Dirichlet Allocation (LDA) 理論
最後更新:
數學, 資料科學, 機器學習, 文字探勘, 非監督式學習, Latent Dirichlet Allocation (LDA)
透過層次結構來執行自然語言處理 (Natural Language Processing),介紹 Latent Dirichlet Allocation。

IMBD 2024 競賽心得
資料科學, 心得, 合作作品
參加 2024 年全國智慧製造大數據分析競賽後的比賽心得: EDA、深度學習?機器學習?、Cross-Validation、Code Review。

軟體生態系 (Software Ecosystems)
資料科學, 心得
介紹軟體生態系,並描述各方關係之間的利害關係,目的是要創造一個可持續的生態體系。