整理人工智慧 AI、機器學習 ML、深度學習 DL－漢亞科技 Han-Ya

「人工智慧」是一個很熱門的話題，不過就技術而言它已經存在已久。最近，我非常專注地閱讀了百度的 Paddle 飛槳網站 https://www.paddlepaddle.org.cn/ 有關人工智慧技術的內容，我覺得它非常清楚地解釋了人工智慧、機器學習和深度學習之間的關係。因此，我特別把這些內容整理起來。從下圖一來解釋這三者的關係，人工智慧 AI 可以被視為應用於各個領域的一種技術，其需要依賴於機器學習 (ML：Machine Learning) 的方法。機器學習技術可以分為兩種主要形式，即早期的傳統學習技術和現代的深度學習技術 (DL：Deep Learning)。

在早期的機器學習中，由於硬體運算效能有限且訊息數據難以大量取得，技術的發展側重於分析訊息的特徵。以我過去學習過的語音和影像技術為例，我們需要分析語音的發音方式，例如聲母、韻母、子音...等，並提取出聲音的特徵，還有從頻譜的角度來分析語音特性。之後，我們建立一個模型，例如隱藏式馬可夫鏈 (HMM)，以便進行語音的訓練和識別。過去，同樣的過程也被運用在影像處理方面，先解析影像訊號，分析影像特性並取得其特徵，再建立影像的模型。從上述描述可以看出，傳統的技術需要對這多媒體訊號的特性進行深入研究，不論是從時域（time domain）或頻譜（frequency domain）的角度來解析訊號的特徵。接著，根據這些特徵建立一套模型，並將有限的數據輸入到模型中，最終進行模型的訓練以獲得適合的結果。這個過程需要對訊息進行大量的研究和分析，並且受限於資源和數據的可用性。

圖一：AI，ML，DL 的關係圖

近年來，隨著物聯網和網路技術的進展，深度學習成為人工智慧的主要技術。儘管深度學習的演算核心是類神經網路，這並不是一個特別新穎的技術。然而，由於現在可以獲得各種海量數據，再加上運算晶片的功效大幅提升，深度學習的技術才逐漸被廣泛採用。整理上述的概念後，下圖二說明兩種機器學習的方法，上半部是傳統的機器學習，下半部是深度學習。上半圖，經過特徵工程獲取輸入訊號的特徵特性，再輸入到一個訓練後的模型，獲得輸出的結果。然而，現在演進到深度學習的技術，透過神經網路的訓練後，這樣的模型也可以達到傳統機器學習的結果。

圖二：機器學習的演進圖 (取自百度 Paddle 網站)

上圖中的類神經網路是深度學習的核心技術，技術的流程可以被細分成幾個部分：數據處理、模型設計、訓練配置、訓練過程和模型保存...等步驟，可以看出關鍵點是模型設計和訓練配置與過程。看似複雜難懂的技術，但從 Paddle 網站上的一段話便能將概念化繁為簡：『无论是计算机视觉任务还是自然语言处理任务，使用的深度学习模型结构都是类似的，只是在每个环节指定的实现算法不同。因此，多数情况下，算法实现只是相对有限的一些选择，如常见的 Loss 函数不超过十种、常用的网络配置也就十几种、常用优化算法不超过五种等等，这些特性使得基于框架建模更像一个编写“模型配置”的过程。』，因此我認為應該善用一些雲端平台所提供的 DL 服務，讓我們更快進入這領域。Paddle 網站提出一套創新教學法，讓初學者容易進入深度學習領域並快速上手，下圖三所顯示用來說明深度學習與 Paddle 雲平台之間的對應關係。圖的左半邊是前面提到的技術步驟，右半邊是 Paddle 平台提供對應左邊技術的函數套件，因為前段說道演算法和訓練方法不過十多種，這些不需要自己再重新開發設計(自己重寫還會遇到 bugs, 除錯, 驗證....等過程，曠日廢時)，只需借用平台寫好的套件即可。