趨勢觀察 -- 三分鐘搞懂深度學習(Deep Learning)


讓電腦具備與人類相同的聽覺、視覺、閱讀甚至翻譯的能力,一直是人工智慧學家追求的目標之一。人類大腦是高度複雜的結構,能藉由許多不同層級的處理,把接收自外界的訊號轉換成人類能理解的訊息。如果讓電腦也用這種「多層次」的處理方式從事辨識活動,較低的層級處理初始訊號、較高的層級辨識比較抽象的意義。





這種類比人腦學習的模式就稱為「深度學習」(deep learning),主要精神是假設一些基礎的訊號(例如聲音的波動)經過一些組合,可以成為較具體的物件(例如聲波組合成單字的讀音),然後具體物件的組合,又可以代表更抽象的意義(例如一組讀音成為一個有意義的詞或句子),所以電腦「學習」這些訊號的過程也應該分層次。

深度學習根源於「類神經網路」(Artificial Neural Network)模型,但今日深度學習的技術和它的前身已截然不同,目前最好的語音辨識和影像辨識系統都是以深度學習技術來完成。日前打敗南韓棋王李世乭的 AlphaGo,其中也運用了深度學習的技術。

深度學習的系統會隨著資料庫越龐大,而變得更有效率。當硬體與網路的不斷進化、各種影音資料急速累積,深度學習技術將會吸引更多研究者發展它的各種可能性,這個技術將是未來的一大趨勢。

Read more:

  1. 深度學習──人工智能的現在與未來 
  2. 台大電機李宏毅教授 「一天搞懂深度學習」


熱門文章