「人工智慧」是一個很熱門的話題,不過就技術而言它已經存在已久。最近,我非常專注地閱讀了百度的 Paddle 飛槳網站 https://www.paddlepaddle.org.cn/ 有關人工智慧技術的內容,我覺得它非常清楚地解釋了人工智慧、機器學習和深度學習之間的關係。因此,我特別把這些內容整理起來。從下圖一來解釋這三者的關係,人工智慧 AI 可以被視為應用於各個領域的一種技術,其需要依賴於機器學習 (ML:Machine Learning) 的方法。機器學習技術可以分為兩種主要形式,即早期的傳統學習技術和現代的深度學習技術 (DL:Deep Learning)。
在早期的機器學習中,由於硬體運算效能有限且訊息數據難以大量取得,技術的發展側重於分析訊息的特徵。以我過去學習過的語音和影像技術為例,我們需要分析語音的發音方式,例如聲母、韻母、子音...等,並提取出聲音的特徵,還有從頻譜的角度來分析語音特性。之後,我們建立一個模型,例如隱藏式馬可夫鏈 (HMM),以便進行語音的訓練和識別。過去,同樣的過程也被運用在影像處理方面,先解析影像訊號,分析影像特性並取得其特徵,再建立影像的模型。從上述描述可以看出,傳統的技術需要對這多媒體訊號的特性進行深入研究,不論是從時域(time domain)或頻譜(frequency domain)的角度來解析訊號的特徵。接著,根據這些特徵建立一套模型,並將有限的數據輸入到模型中,最終進行模型的訓練以獲得適合的結果。這個過程需要對訊息進行大量的研究和分析,並且受限於資源和數據的可用性。
圖一:AI,ML,DL 的關係圖 |
近年來,隨著物聯網和網路技術的進展,深度學習成為人工智慧的主要技術。儘管深度學習的演算核心是類神經網路,這並不是一個特別新穎的技術。然而,由於現在可以獲得各種海量數據,再加上運算晶片的功效大幅提升,深度學習的技術才逐漸被廣泛採用。整理上述的概念後,下圖二說明兩種機器學習的方法,上半部是傳統的機器學習,下半部是深度學習。上半圖,經過特徵工程獲取輸入訊號的特徵特性,再輸入到一個訓練後的模型,獲得輸出的結果。然而,現在演進到深度學習的技術,透過神經網路的訓練後,這樣的模型也可以達到傳統機器學習的結果。
圖二:機器學習的演進圖 (取自百度 Paddle 網站) |
上圖中的類神經網路是深度學習的核心技術,技術的流程可以被細分成幾個部分:數據處理、模型設計、訓練配置、訓練過程和模型保存...等步驟,可以看出關鍵點是模型設計和訓練配置與過程。看似複雜難懂的技術,但從 Paddle 網站上的一段話便能將概念化繁為簡:『无论是计算机视觉任务还是自然语言处理任务,使用的深度学习模型结构都是类似的,只是在每个环节指定的实现算法不同。因此,多数情况下,算法实现只是相对有限的一些选择,如常见的 Loss 函数不超过十种、常用的网络配置也就十几种、常用优化算法不超过五种等等,这些特性使得基于框架建模更像一个编写“模型配置”的过程。』,因此我認為應該善用一些雲端平台所提供的 DL 服務,讓我們更快進入這領域。Paddle 網站提出一套創新教學法,讓初學者容易進入深度學習領域並快速上手,下圖三所顯示用來說明深度學習與 Paddle 雲平台之間的對應關係。圖的左半邊是前面提到的技術步驟,右半邊是 Paddle 平台提供對應左邊技術的函數套件,因為前段說道演算法和訓練方法不過十多種,這些不需要自己再重新開發設計(自己重寫還會遇到 bugs, 除錯, 驗證....等過程,曠日廢時),只需借用平台寫好的套件即可。
全站熱搜
留言列表