# 這費是法 投稿:看到前面這篇算法之國:中國人工智能的興起,寫了這篇原創(chuàng)
Receptive fields of single neurones in the cat's striate cortex
D. H. Hubel and T. N. Wiesel(59年的論文,應該是公共領域了)
我們離真正的通用人工智能還非常非常遠,但是進步的非常非常快?,F(xiàn)在兩個極端,談AI色變,要被skynet干掉了;AI是噱頭,沒用,過兩年就消停了。都不好,都源自不了解。所以原創(chuàng)一個簡單的介紹內容。以及說一說如果真的想跳這個坑,怎么優(yōu)雅而高效的跳進去。
現(xiàn)在所有的所謂AI都應該被稱為機器學習或者數(shù)據(jù)驅動編程。真正這個領域里面的人極少會說自己是搞AI的,最多最多帶上學習兩個字,機器學習,或者模式識別這樣的。最熱門的圖像識別領域其實是一個非常細分的專業(yè)領域,但是其中卷積神經網絡的思想在一定的范圍內可以被視為通用的機器學習技術。以貓圖為例,我們不再是通過結構化的代碼去實現(xiàn)分辨圖中是否有貓,而是實現(xiàn)一個機器學習的范式,用數(shù)據(jù)來驅動代碼對貓圖進行判斷。
這些工作需要大量的經過標注的數(shù)據(jù)集比如imageNet,通常的樣子是這張圖里有貓,這張圖里沒有貓,然后去訓練對應的學習結構。當然這樣的思想可以用在別的領域。但是需要注意的是,這里的關鍵在于完全信息。簡單的判斷就是,如果你是個人,給你這個數(shù)據(jù),你能不能判斷出來標記。給你看有貓的圖,你能說,這里有貓。給你看沒有貓的圖,你能說,這里沒有貓。給你看“學 小組”,你能知道很可能是“學習小組”。另一個領域是非完全信息的領域,那就會面臨其他的很多問題,最近打撲克的那個也是很厲害的。
前面說的都是監(jiān)督學習,你需要提供有標記的數(shù)據(jù)集。那么未來的方向一定是非監(jiān)督學習。我們直接給圖,不再提供圖里面“有什么”這樣的標記。目前來看,最厲害的微軟研究院的resNet可以在圖像識別方面做到超越人類的識別正確率,但是需要注意的是,這只是圖像識別這樣一個非常細分的領域。這有巨大的價值,簡單的例子,把貓換成CT片,標記換成有惡性病變還是么有惡性病變,你就不用在拿著CT片子去找醫(yī)生看做診斷,訓練好的卷積神經網絡能夠以比任何醫(yī)生還要高的準確率來作出診斷。
這個領域和神經生物學,認知理論,語義處理等領域有非常多的交叉;而且實踐起來相對的簡單,能夠迅速的轉化為經濟收益,所以大量的極其聰明的人加入其中。競爭極其激烈,以谷歌為例,最聰明的人,用著跑在自己開發(fā)的TPU(張量處理器)集群上TensorFlow構建的百多層深的卷積網絡。任何嚴肅的想要加入這場競爭的人大概都需要想想在這些環(huán)境下自己客觀的定位是什么。
接下來講講怎么優(yōu)雅的跳這個大坑。首先這個領域太熱,所以一定要專業(yè),不要去吃二手糧,要直奔大牛。這個領域非常開放,大部分的論文和代碼都是開放的,耐心去看吧,看個半年,從開始到最前沿的東西也就看下來了。
按重要性排序的前提條件:
1、能科學的訪問某著名網絡公司。
2、英文聽讀沒有問題,可以聽專業(yè)課的程度。
3、線性代數(shù)很重要。
4、Git和Github要會用,至少知道怎么commit和怎么回滾。
5、C++至少明白1分(要記住大神也就明白8分)。
6、Python要用好。
7、Linux要會用。
8、StackOverflow要善用。
9、朝死了搜索,找領域大牛的論文囫圇完了順著參考文獻擼。
入門很重要:
1、Coursera上面吳恩達的課程可以作為非常好的入門
2、接下來是多倫多大學Hinton大神的神經網絡課程可以作為下一道菜
3、斯坦福李飛飛的CS231n課程是非常好的圖像識別的課程
上面套路下來基本就在坑里面了,接下來你需要接著往下挖。這里需要問一個問題,為什么要接著往下挖?
數(shù)據(jù)!數(shù)據(jù)!數(shù)據(jù)!如果你的工作中接觸到大量的數(shù)據(jù),而且原有的處理方式可以有優(yōu)化空間,那你就使勁挖吧,將會帶來實實在在的收益。但是如果你純粹的想搭AI這班車,開頭已經說過了,這班車不存在。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )