首頁

／

AI 知識庫

／

機器學習入門必看！5 分鐘搞懂機器學習定義、類型＋應用範例！

AI 知識庫

黃適文．

2024-10-08

機器學習入門必看！5 分鐘搞懂機器學習定義、類型＋應用範例！

機器學習是什麼？機器學習、深度學習差異是什麼？本文將用最白話的方式帶你認識機器學習流程 7 步驟與 4 種機器學習類型，最後分享機器學習應用實例，機器學習入門者必看！

快速跳轉目錄

機器學習是什麼？AI 人工智慧 vs 機器學習 vs 深度學習！

機器學習類型｜4 種機器學習類型 1 次看！

機器學習應用案例分享：生活＆商業真實案例！

機器學習入門必看！免費文章、課程推薦給你！

機器學習是什麼？AI 人工智慧 vs 機器學習 vs 深度學習！

為什麼網購平台總是能推薦你可能喜歡的商品？為什麼 Netflix 可以知道你接下來想看什麼影集？為什麼 Facebook 可以辨識相片上有誰？

今天就來跟大家說說這些 AI 應用背後的神奇智慧：機器學習！

（一）何謂機器學習？3 分鐘帶你認識機器學習定義！

你可能會有這個疑惑：「機器學習、人工智慧一樣嗎？」

機器學習是包含在人工智慧裡的架構裡，由於近年來機器學習過於熱門，有許多人誤將人工智慧與機器學習畫上等號，其實這兩者是完全不相同的～

機器學習（Machine Learning，ML）是一種人工智慧的應用，透過演算法分類、解析與吸收資料，再加上不斷的訓練與學習，進而達到預測結果的 AI 機器學習模式。

讓我們試著用最簡單的方式解釋給你聽：

什麼是 AI 人工智慧？簡單來說就是希望機器可以跟人類一樣有智慧。那要怎麼讓機器有智慧呢？其中一個方法就是機器學習！

機器學習就像學生在學習一樣，透過大量的課堂教學、回家作業等練習過程，歸納出一套知識間的邏輯關係、解題方法等，並在考試的時候運用這些內化的知識來回答問題。

▋ 機器學習優點

洞察力：機器學習可以從大量資料中找出人類難以察覺或是被忽略的模式和趨勢，幫助我們做出更明智的決策。
自動化：一旦設定完成，機器學習模型就可以自動執行任務，大量節省人力，並提高效率。
持續優化：機器學習模型會隨著資料量的增加和時間的推移不斷學習和改進，預測結果會越來越精準，這也讓機器學習在處理動態資料時具有明顯的優勢。
靈活性：機器學習模型可以處理不同格式和來源的資料，使它能夠應用於各種不同的情境，例如：預測商品銷售量、分析客戶行為、偵測詐騙行為等。

（二）機器學習如何運作？機器學習流程 7 步驟！

機器學習步驟大致可以分為 7 步。下面用 Google Cloud Tech 的教學影片舉例說明，以訓練一個可以分辨啤酒與葡萄酒的模型為例，帶你了解機器學習的 7 個步驟，並附上機器學習流程圖供你參考！

機器學習 7 步驟

1️⃣ 收集資料（Gathering data）

為了訓練出能夠準確分辨啤酒與葡萄酒的模型，首先第一步是要「收集資料」，關於這 2 種飲料的資料蒐集有很多，例如泡沫的量、玻璃杯的形狀。

我們選擇 2 種最簡單的資料作為判斷特徵：酒的顏色（光的波長）、酒精含量，接著就可以開始收集與整理各種啤酒、葡萄酒的特徵資料。

此步驟非常重要，因為資料的質量和數量會直接影響模型的好壞！

2️⃣ 準備資料（Preparing that data）

準備資料是將前一步驟收集到的訊息變成培訓數據的過程。首先為了確保順數據序不會影響模型的訓練，我們需要將所有資料打亂順序。在準備資料的過程，可以順便檢視 2 種飲料資料蒐集的數量是否有平均！

同時還要將打散的資料分成 2 大部分，一部分佔大多數（80%），用來讓機器對照數據；另一部分佔少數（20%），用來測試訓練完成的模型。

3️⃣ 選擇模型（Choosing a model）

接著進入選擇模型（演算法），不同模型擅長分析的資料類型都不盡相同，有些模型適合分析圖像、有些適合分析數字等。

在這個例子中，我們可以使用線性模型來幫助機器訓練。

4️⃣ 訓練模型（Training）

選好模型後就進入正式的訓練階段，在訓練的過程中會不斷在錯誤、練習、修正與調整中循環。

5️⃣ 分析評估（Evaluation）

訓練完成後需要評估模型是否真的有用。此步驟可以使用前面我們在準備資料時預留的 20%測試數據，評量模型在面對全新數據時的回答準確度。

6️⃣ 超參數調整（Hyperparameter tuning）

做完分析與評估後，就可以根據測試結果再作進一步的超參數修正，並測試多組不同超參數的模型，來看看哪組能提供最佳結果。

7️⃣ 預測結果（Prediction）

最後！就可以拿訓練好的模型來回答問題囉～

✨ 以下為 Google Cloud Tech 的教學影片，歡迎參考！

（三）機器學習、深度學習傻傻分不清？快速掌握 2 者差異！

然而，機器學習也不是萬能的，當碰到數據與情況更複雜、層次更高的應用時，機器學習可能就無法有效運作。因此「深度學習」就誕生啦！

簡單來說：

機器學習 ➤ 從過去的資料中找出一套規則
深度學習 ➤ 整理出規則的其中一個方法

深度學習（Deep Learning）是以人類大腦為參考所開發的學習技術。

人們希望機器可以像人類的大腦一樣，透過神經元之間的連接產生智慧，因此產生了類神經網路（Neural Network）領域，後續又演變成深度學習（Deep Learning）。

深度學習是透過模仿人類大腦的類神經網路，使用多層神經網路來處理資料，從資料輸入再經過數個隱藏層，最後到達輸出層。這個過程使深度學習能夠分辨出更複雜、更準確的資訊！

深度學習最知名的例子應該就是打敗世界知名圍棋大師的 Google AlphaGo！

▋ AI vs 機器學習 vs 深度學習

人工智慧（AI）、機器學習、深度學習差異到底是什麼呢？如果各用 1 句話來形容這 3 者間的關係：

人工智慧 ➤ 目標是讓機器具有人類的智慧
機器學習 ➤ 從大量資料中找出規則，以達到智慧化的目標
深度學習 ➤ 機器學習的其中一種方法，模仿人類大腦的類神經網路去分析數據資料

AI vs ML vs DL

機器學習類型｜4 種機器學習類型 1 次看！

如同前面介紹機器學習 7 步驟時所說，在訓練機器學習時，會運用到許多不同的機器學習演算法，例如線性回歸法、邏輯回歸法等，我們可以大致將各種演算法分為 4 種類型：監督式學習、非監督式學習、半監督式學習、強化式學習。

（一）監督式學習（Supervised Learning）

▋ 監督式學習定義

提供機器大量有歷史資料、有標記標籤的「輸入」和「輸出」資料配對分類。例如，我們給機器多組啤酒與葡萄酒的影像，並標記出哪些是啤酒，哪些是葡萄酒。機器會學習這些資料，並找出這些影像間的共同特徵，以分辨啤酒與葡萄酒。

⚑ 常見的監督式學習演算法有：

線性回歸法（Linear Regression）
隨機森林法（Random Forest）
單純貝氏分類器（Naive Bayes Classifier）

▋ 監督式學習例子

推薦系統就是利用監督式學習，例如 Netflix 的影集推薦。Netflix 的推薦系統會根據用戶過去的觀看紀錄與行為，推薦用戶可能會喜歡的節目。

（二）非監督式學習（Unsupervised Learning）

▋ 非監督式學習定義

在非督導式學習模式中，輸入的資料多是沒有標準答案、未標記與非結構化的資料。機器會使用所有相關且可存取的資料來識別資料間的關聯性，並將資料分群。

⚑ 常見的非監督式學習演算法有：

K-平均算法（K-Means Cluctering）
主成分分析（PCA）
t-分布隨機鄰近嵌入（t-SNE）

▋ 非監督式學習例子

非監督式學習可以解決各種商業問題，有助於企業快速探索大量資料，例如銀行用來監測交易是否為詐欺或機器人活動等異常行為。

（三）半監督式學習（Semi-supervised Learning）

▋ 半監督式學習定義

半監督式學習則是指，有一部分的資料有標記，另一部分則沒有。半監督學習會先用已標記過的資料訓練模型，之後再使用經過訓練的模型來標記那些未標記的資料，直到所有資料都被標記完成。

⚑ 常見的半監督式學習演算法有：

生成式對抗網路（Generative adversarial networks）
自學習貝氏分類器（Self-trained Naive Bayes classifier）

▋ 半監督式學習應用

半監督式學習經常應用在語音與語言分析，例如使用少量的語音數據來訓練模型，並利用大量的未標記語音數據來進一步學習，提高辨識的準確度。

（四）強化式學習（Reinforcement Learning）

▋ 強化式學習定義

強化式學習也叫做增強式學習，指機器在處理資料時，會像學生學習一樣，透過「獎勵和懲罰」來學習，每當它做出一個動作，就會得到一個「意見回饋」：如果這個動作是好的，它就得到「獎勵」，反之則是「懲罰」。

透過不停的試錯，慢慢了解哪些動作是好的，哪些動作是壞的，最終找到最有效的處理資料路徑，達到最終目標。

⚑ 常見的增強式學習演算法有：

Q 學習（Q-Learning）
蒙特卡洛學習（Monte-Carlo Learning）
SARSA （State–Action–Reward–State–Action）

▋ 強化式學習應用

強化式學習最知名的案例，莫過於 2014 年 Google DeepMind 開發的下圍棋軟體 AlphaGo。AlphaGo 一開始是使用監督式學習，不過由於學習與進步的速度太慢了，因此改使用強化式學習的方式提高棋力。

機器學習類型	特色	常見演算法
監督式學習	有標準答案資料需要標記	線性回歸法（Linear Regression）隨機森林法（Random Forest）單純貝氏分類器（Naive Bayes Classifier）
非監督式學習	沒有標準答案資料沒有標記	K-平均算法（K-Means Cluctering）主成分分析 (PCA) t-分布隨機鄰近嵌入（t-SNE）
半監督式學習	一部分的資料有標記，另一部分沒有標記	生成式對抗網路（Generative adversarial networks）自學習貝氏分類器（Self-trained Naive Bayes classifier）
強化式學習	有獎勵與懲罰機制	Q 學習（Q-Learning）蒙特卡洛學習（Monte-Carlo Learning） SARSA （State–Action–Reward–State–Action）