劉興亮 | 極簡(jiǎn)神經(jīng)網(wǎng)絡(luò)史

01

寫(xiě)在開(kāi)頭的

神經(jīng)網(wǎng)絡(luò)是一種受生物啟發(fā)的優(yōu)美編程范式,由相互連接的單元或節(jié)點(diǎn)(稱(chēng)為人工神經(jīng)元)組成,其組件特征模擬了人類(lèi)大腦中的神經(jīng)元。它使計(jì)算機(jī)能夠從觀(guān)察到的數(shù)據(jù)中進(jìn)行學(xué)習(xí),形成概念,做出判斷,給出結(jié)論。

如今人人依賴(lài)的人工智能模型依靠的就是深度學(xué)習(xí)——一套強(qiáng)大的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)技術(shù),為圖像識(shí)別、語(yǔ)音識(shí)別和自然語(yǔ)言處理領(lǐng)域的許多問(wèn)題提供了最佳解決方案。

黑格爾在其晦澀難懂的著作《精神現(xiàn)象學(xué)》中說(shuō):「當(dāng)花朵盛開(kāi)時(shí),花蕾消逝了,而我們可能會(huì)說(shuō)花蕾被花朵否定了?!咕痛?,黑格爾將「觀(guān)念置于歷史進(jìn)程中」,使二者合二為一。

沒(méi)有一套固定不變的神經(jīng)網(wǎng)絡(luò)概念,只有神經(jīng)網(wǎng)絡(luò)的歷史,一套變化的觀(guān)念集群。

下面我們簡(jiǎn)單梳理一下神經(jīng)網(wǎng)絡(luò)的發(fā)展歷史。

02

對(duì)大腦的認(rèn)識(shí)

知其然還得知其所以然。對(duì)人類(lèi)如何能夠思維以及思維能力的容器——大腦的研究始終不過(guò)時(shí)。

1)很長(zhǎng)時(shí)間內(nèi),人類(lèi)有相當(dāng)一部分人認(rèn)為人的意識(shí)是在心臟。古埃及人在制作木乃伊?xí)r常將大腦丟棄,認(rèn)為心臟才是思維和情感的中心。

2)公元前5世紀(jì),古希臘的希波克拉底首次提出大腦可能是思維和感知的中心。

3)到公園2世紀(jì),古羅馬的蓋倫通過(guò)動(dòng)物解剖提出大腦與神經(jīng)系統(tǒng)有關(guān),強(qiáng)調(diào)「腦室理論」——認(rèn)為心理功能發(fā)生在腦室中,他是古代解剖學(xué)的奠基人之一。至此,人們注意到大腦才是意識(shí)的發(fā)生地。但對(duì)大腦結(jié)構(gòu)的研究仍然要到文藝復(fù)興以后才興起。

4)到20世紀(jì),神經(jīng)科學(xué)興起。拉蒙·卡哈爾證明大腦是由獨(dú)立的神經(jīng)元構(gòu)成,而非一個(gè)整體網(wǎng)絡(luò)。由此,隨著神經(jīng)元學(xué)說(shuō)的確立,分子神經(jīng)科學(xué)與認(rèn)知科學(xué)的興起,人們逐步深入研究突觸、神經(jīng)遞質(zhì)、記憶機(jī)制等等。

03

前神經(jīng)網(wǎng)絡(luò)史

沒(méi)有任何一門(mén)學(xué)科是孤立發(fā)展起來(lái)的,必然伴隨著與社會(huì)總體變化相對(duì)應(yīng)的廣泛領(lǐng)域的觀(guān)念發(fā)展,以及由此帶來(lái)的相互影響。神經(jīng)科學(xué)(腦科學(xué))的基礎(chǔ)研究對(duì)神經(jīng)網(wǎng)絡(luò)(機(jī)器學(xué)習(xí))起到了奠基和啟發(fā)作用。

在神經(jīng)網(wǎng)絡(luò)形成概念之前,已經(jīng)有一些歷史的萌芽在潛伏和悄悄發(fā)展。追溯起來(lái),如今的深度神經(jīng)網(wǎng)絡(luò)基于200 多年前統(tǒng)計(jì)學(xué)的早期研究。

統(tǒng)計(jì)學(xué)怎么會(huì)跟神經(jīng)網(wǎng)絡(luò)關(guān)聯(lián)呢?

首先,我們一直在討論神經(jīng)網(wǎng)絡(luò),其中一層的輸出用作下一層的輸入,這樣的網(wǎng)絡(luò)被稱(chēng)為前饋神經(jīng)網(wǎng)絡(luò)。前饋神經(jīng)網(wǎng)絡(luò)的標(biāo)準(zhǔn)學(xué)習(xí)算法是——隨機(jī)梯度下降。利用梯度下降優(yōu)化權(quán)重,而這一步是權(quán)重推導(dǎo)的核心。

換句話(huà)說(shuō),模型通過(guò)觀(guān)察「當(dāng)前預(yù)測(cè)錯(cuò)在哪」,計(jì)算每個(gè)權(quán)重對(duì)錯(cuò)誤的「貢獻(xiàn)」,然后反方向修正。這個(gè)修正是不斷反復(fù)的,直至最后的權(quán)重參數(shù)導(dǎo)出最佳答案。

變量和權(quán)重,是深度學(xué)習(xí)中最多出現(xiàn)的因素。沒(méi)有變量,當(dāng)然也就沒(méi)有結(jié)果;但沒(méi)有權(quán)重就沒(méi)有正確的結(jié)果。

好了,現(xiàn)在回到200年前,數(shù)學(xué)家勒讓德和高斯曾用線(xiàn)性回歸的統(tǒng)計(jì)學(xué)方法來(lái)對(duì)一組點(diǎn)進(jìn)行良好的粗略線(xiàn)性擬合,以預(yù)測(cè)行星運(yùn)動(dòng)。其原理與前饋神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法是相似的。

200年前的線(xiàn)性回歸統(tǒng)計(jì)法,與如今前饋神經(jīng)網(wǎng)絡(luò)的梯度下降法是一種東西。

04

早期

1)1943年,心理學(xué)家W.S. McCulloch和數(shù)學(xué)家W.A. Pitts提出了第一個(gè)神經(jīng)元計(jì)算模型,為人工神經(jīng)網(wǎng)絡(luò)奠定了理論基礎(chǔ),證明了簡(jiǎn)單的神經(jīng)元網(wǎng)絡(luò)可以進(jìn)行邏輯運(yùn)算。

2)1940年代末,Donald O. Hebb提出了一種基于神經(jīng)可塑性機(jī)制的學(xué)習(xí)假說(shuō),即后來(lái)的赫布學(xué)習(xí)。它被用于許多早期的神經(jīng)網(wǎng)絡(luò)。

3)1950年,艾倫·圖靈提出了「圖靈測(cè)試」,為機(jī)器智能的評(píng)估提供了概念。

4)1956年,在達(dá)特茅斯會(huì)議上,約翰·麥卡錫首次提出了“人工智能”這一概念。

5)1958年,F(xiàn)rank.Rosenblatt研制出感知機(jī),這是歷史上第一個(gè)能進(jìn)行模式識(shí)別的神經(jīng)網(wǎng)絡(luò)設(shè)備,可以實(shí)現(xiàn)基于兩層計(jì)算機(jī)學(xué)習(xí)網(wǎng)絡(luò)的模式識(shí)別。它引入了二元分類(lèi)器的概念,通過(guò)調(diào)整權(quán)重從數(shù)據(jù)中學(xué)習(xí)。盡管感知機(jī)只能解決線(xiàn)性可分問(wèn)題,但它標(biāo)志著神經(jīng)網(wǎng)絡(luò)進(jìn)入了新的發(fā)展階段。

05

突破、波折期

20 世紀(jì) 60 年代和 70 年代對(duì)人工神經(jīng)網(wǎng)絡(luò)進(jìn)行了基礎(chǔ)研究。

1)1965年,蘇聯(lián)的Alexey Ivakhnenko和 Lapa發(fā)表第一個(gè)可行的深度學(xué)習(xí)算法是數(shù)據(jù)處理的組方法,這是一種訓(xùn)練任意深度神經(jīng)網(wǎng)絡(luò)的方法。

2)1967年,第一個(gè)通過(guò)隨機(jī)梯度下降訓(xùn)練的深度學(xué)習(xí)多層感知器由Shun'ichi Amari發(fā)表。

3)1969年:Minsky和Papert的《感知機(jī)》出版。這本書(shū)指出了單層感知機(jī)的局限性,即無(wú)法解決異或(XOR)問(wèn)題,這極大地打擊了人們對(duì)神經(jīng)網(wǎng)絡(luò)的熱情,導(dǎo)致了「AI寒冬」。

4)但同在1969年,福島邦彥 (Kunihiko Fukushima)提出了ReLU (整流線(xiàn)性單元) 激活函數(shù)。整流器已成為深度學(xué)習(xí)中最流行的激活函數(shù)。

5)1970年代, Paul Werbos在博士論文中提出了反向傳播(Backpropagation)算法,但當(dāng)時(shí)并未引起廣泛關(guān)注。

06

快速發(fā)展期

1980年代是反向傳播算法的重新發(fā)現(xiàn)和應(yīng)用期。由Geoffrey Hinton等人的研究重新發(fā)現(xiàn)了反向傳播算法,并證明了其在多層神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的有效性。這使得多層神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)成為可能,并重新激發(fā)了對(duì)神經(jīng)網(wǎng)絡(luò)的研究興趣。

1)1982年,J.J. Hopfield提出了Hopfield神經(jīng)網(wǎng)絡(luò)模型,在優(yōu)化問(wèn)題和聯(lián)想記憶方面展現(xiàn)了潛力。

2)1985年,Yann LeCun和Yoshua Bengio開(kāi)發(fā)了卷積神經(jīng)網(wǎng)絡(luò)(前饋神經(jīng)網(wǎng)絡(luò)的一種)。卷積神經(jīng)網(wǎng)絡(luò)在1994年被LeCun成功應(yīng)用于手寫(xiě)郵政編碼識(shí)別,識(shí)別率達(dá)到99%,并被美國(guó)郵政系統(tǒng)采用,這是卷積神經(jīng)網(wǎng)絡(luò)在實(shí)際應(yīng)用中的一個(gè)里程碑。

3)1991年,Sepp Hochreiter在其畢業(yè)論文中識(shí)別并分析了梯度消失問(wèn)題,并提出了循環(huán)殘差連接來(lái)解決該問(wèn)題。他和 Schmidhuber 提出了長(zhǎng)短期記憶網(wǎng)絡(luò),并在多個(gè)應(yīng)用領(lǐng)域創(chuàng)下了準(zhǔn)確率紀(jì)錄。

4)1985 年至 1995 年間,受統(tǒng)計(jì)力學(xué)的啟發(fā),Terry.Sejnowski、Peter.Dayan、Geoffrey. Hinton等人開(kāi)發(fā)了幾種架構(gòu)和方法,包括玻爾茲曼機(jī)、限制玻爾茲曼機(jī)、亥姆霍茲?rùn)C(jī)、喚醒-睡眠算法。這些都是為深度生成模型的無(wú)監(jiān)督學(xué)習(xí)而設(shè)計(jì)的。

07

成熟期(深度學(xué)習(xí))

1)2006年,深度學(xué)習(xí)爆發(fā)年。Geoffrey Hinton等人發(fā)表了關(guān)于深度置信網(wǎng)絡(luò)的快速學(xué)習(xí)算法,解決了深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的梯度消失問(wèn)題,證明了深度神經(jīng)網(wǎng)絡(luò)通過(guò)預(yù)訓(xùn)練和微調(diào)可以有效地進(jìn)行學(xué)習(xí)。這標(biāo)志著「深度學(xué)習(xí)」概念的正式提出和興起。

2)2012年,在ImageNet圖像識(shí)別挑戰(zhàn)賽中,Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton共同開(kāi)發(fā)的AlexNet(一個(gè)深層卷積神經(jīng)網(wǎng)絡(luò))取得了突破性的成果,以遠(yuǎn)超第二名的表現(xiàn)贏得了比賽,證明了深度學(xué)習(xí)在處理復(fù)雜高維度數(shù)據(jù)(如圖像、文本和聲音)方面的強(qiáng)大能力。

3)2016年,Google DeepMind開(kāi)發(fā)的AlphaGo擊敗人類(lèi)圍棋冠軍,引發(fā)了社會(huì)對(duì)人工智能的廣泛關(guān)注。

4)2017年,Google提出了Transformer模型,徹底改變了自然語(yǔ)言處理領(lǐng)域,成為后續(xù)大型語(yǔ)言模型的基礎(chǔ)。

08

寫(xiě)在最后的

但是神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力,是建立在科學(xué)的邏輯推理能力(即對(duì)變量權(quán)重的合理使用)上,而這需要硬件更強(qiáng)大更不計(jì)次數(shù)的計(jì)算能力,因此伴隨著神經(jīng)網(wǎng)絡(luò)發(fā)展的是人類(lèi)在計(jì)算機(jī)芯片上的投入和突破。二者是互為一體的。

以上極簡(jiǎn)神經(jīng)網(wǎng)絡(luò)史,離不開(kāi)芯片發(fā)展史。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀(guān)察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀(guān)點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2025-06-11
劉興亮 | 極簡(jiǎn)神經(jīng)網(wǎng)絡(luò)史
劉興亮|極簡(jiǎn)神經(jīng)網(wǎng)絡(luò)史

長(zhǎng)按掃碼 閱讀全文