我与AI:我的“机器学习”过程
如果說要論機器學習的歷史,最早可以追溯到18世紀關于最小二乘法和馬爾可夫鏈的推導,這些構成了機器學習的基礎。上世紀50年代,艾倫·圖靈關于“圖靈機”的設想以及馮·諾伊曼的計算機體系結構的設計讓機器學習這個概念逐漸變為了現實。從上世紀50年代末F·Rosenblatt的“Perceptron”模型一直到現在的各類神經網絡模型,各種各樣機器學習的算法模型的大量出現還是科幻小說中對于智慧AI的大膽設想都證實了機器學習對于人類生活生產的重要價值。可以說,機器學習這項技術對于現在的人類社會是不可或缺的。
機器學習對于制造業或互聯網相關工作也十分必要,大量計算機方面的工作都需要了解Python或者機器學習相關的技術。互聯網+、機器學習和制造業的相關結合也是中國目前發展的重要方向。可以說,機器學習也是互聯網方面工作中不可或缺的重要知識基礎和未來發展方向。
對于計算機、金融、數據分析、自動化等各種與計算機相結合的專業的同學來說,機器學習同樣也不可或缺。無論是以后發表相關論文還是各類互聯網+項目,機器學習可以說是非常重要的。任何相關專業和機器學習的有效結合可以大幅提高論文和項目的含金量,了解或學習機器學習相關知識,如果在未來的論文或項目中涉及到機器學習的相關內容和創新也不會感到發怵,反而能夠得心應手,大幅提高論文和項目的質量。
2.1 緣何相識“機器學習”
我是一位科班畢業的計算機學生,即將攻讀計算機方向研究生,但是慚愧地說,我在本科階段并沒有學習機器學習相關的課程,對機器學習完全沒有任何概念,一直到了大四我保研后,研究生導師突然讓我開始做機器學習相關的畢業設計時我才發現我對機器學習完全沒有任何了解。我上過類似吳恩達的機器學習相關課程,也讀過周志華的機器學習“西瓜書”,但是里面大量繁雜冗余的公式都讓我望而卻步。只能觀其表面,不理解其內在含義,這會在以后的學習和工作中非常吃虧。
為了去理解這些公式帶來的含義,提升自己的機器學習基礎能力,我去找了很多相關的教材和視頻,嘗試去理解這些公式,但是完全靠自己去理解還是過于困難,沒有一個好的老師輔助去教授這些知識,我還是不能理解這些復雜公式帶來的含義。印象最深刻的就是學習SVM的核函數的時候,只學過微積分、概率論和線性代數的我當聽到特征希爾伯特空間的時候整個人都是懵的,很多公式的數學符號我也完全看不懂,但是在書中學習這些基礎的時候又不可避免地要學習這些公式。
為了解決機器學習老大難的問題,我決定還是去網絡上搜索一些機器學習相關的完備課程來輔助我學習,而不是搜索單一的視頻或者書籍。這樣也是為了未來的研究生學習打下良好基礎。就這樣,我發現了一個課程:貪心AI“機器學習基礎”課程。
2.2 “貪心AI”為何甚好
課程設計
貪心AI的機器學習基礎課程分為了共計17章節,從最簡單的機器學習基礎知識、線性回歸模型,到后來的SVM,神經網絡,全都有非常詳細的課程設計,比如對于SVM來說,就包含了包括對Support Vector的直觀理解,線性可分的支持向量機這類早期的SVM模型以及到后來的核函數的理解,特征希爾伯特空間的理解,從線性支持到非線性支持等。難度在一章中也是逐漸上升的,模型的復雜度也是從淺入深。而且在每章視頻課程之后,課程還會讓我開發一個基礎的機器學習算法,將課上講解的知識和公式用代碼表示出來。不僅是因為代碼表示的話就可以保證我們完全理解這個模型的公式(如果不理解的話自然也就無法寫出代碼了),可以說是知識和實踐相結合了。
我在自己學習機器學習的時候從來沒想過自己手寫一個機器學習的算法,都是利用的各類框架,例如Tensorflow、Pytorch、sklearn等。這樣雖然學習非常快,但是也只是觸及機器學習的皮毛,不能理解機器學習的內在含義,在未來面對各種各樣的機器學習模型,尤其是這些框架所不涉及的模型時,或者以后要查看每篇機器學習的論文的代碼時,我也就無從下手了,只得現學現賣。但是貪心AI的課程就和我自學完全不一樣,貪心AI的課程深度和廣度兼具,而且難度設置也非常合理。我從最開始的機器學習介紹開始學習,先將機器學習的概念進行一些梳理,然后立即開始動手開發一個AI程序,還通過身高預測體重這樣簡單的案例入手機器學習,非常生動形象。第一次寫完這個程序的時候我個人覺得整個程序其實非常簡單,最初級的機器學習也沒什么難的,也沒有特別的“高大上”,畢竟機器學習真正的含金量體現在模型和算法上,至于代碼無非也就是這些的實現而已。后面的章節難度逐漸提升,從我高中時代就學過的線性回歸方程開始學習,然后逐步提升到比如貝葉斯算法(這也正是我研究生的研究方向之一)、隨機森林(重要,現在傳統機器學習算法中隨機森林都表現出極好的特性),再之后就到了深度神經網絡、SVM這樣更加困難的算法。但是我覺得完全不用擔心難度的問題,因為每章都會配合練習題或者案例對每個章節介紹的機器學習模型進行一個鞏固、夯實、提高的過程,這樣做能夠讓我更加牢固地理解每章教授的機器學習模型的概念、意義和使用場景。模型學習多了,在掌握了機器學習的基礎概念之后,再多的模型也就能像學習各種各樣五花八門計算機語言一樣卻不用擔心學不會一樣,只要能夠抓住核心概念,就算模型難度在升高,學習成本也在逐漸降低。畢竟在通過貪心AI課程學習的過程中,有關機器學習概念和基礎是越來越牢固的。
課程內容
之前我在自學機器學習的時候,無論是書籍還是各類視頻資料等,老師在講解機器學習模型算法的時候我總是覺得講解的不夠仔細。老師在講解的時候,有時候前后邏輯不對或者老師跳過了一些他認為學生理所應當理解的一些知識時,我就不能理解模型算法公式代表的意義了(比如前面SVM中的特征希爾伯特空間,很多書中并未詳細描述意義),但是因為是視頻資料或者書籍資料,我不理解的時候又不能立即進行反饋,這樣我就只能選擇跳過不理解的部分。跳過的部分多了起來,我就只能理解皮毛不知其深淺了。但是貪心AI的課程卻不一樣。不僅老師在講解的時候非常細致,講解每章內容的時候每一個點都講的非常豐富,而且全程還有專業助教來解答學生的各類問題,比如我學習的線性回歸章節,雖然內容確實在整個課程中算是很簡單的了,而且線性回歸本身也是高中就學習過的數學知識,但是我同樣存在一些沒有理解的問題,尤其是針對多元線性回歸方面我不是很理解(高中學習的不是很深入),我就立即去詢問助教,這樣就算我真的不理解老師這堂課介紹的模型的部分細節,我也能夠立即通過助教去了解,這樣就可以強化我所學的知識。而且每次課程結束都會有大量習題進行練習,做題的時候如果做對了自然是成就感爆棚,但是就算做錯了,我在做題的同時也可以糾正并強化這節課所學的知識。這樣的話,我也算做到了理解機器學習各類模型算法的意義,而不是像自學的時候學完一個模型也就草草了事,沒有深入去理解模型的算法和適用意義。
課程師資
我自學機器學習的時候,因為都是從網絡上搜索視頻書籍資料,就完全不能保證師資力量,各種各樣的人都有,有些教的不錯,有些人甚至他們自己都略懂皮毛。最離譜的是我還遇到過明明是兩個教同一個模型的視頻資料,但這兩個資料對這個模型的理解都完全不一樣的情況。但是貪心AI的師資力量卻非常優秀,而且做到了統一。比如說李文哲老師,李文哲老師是貪心AI的創始人,也是貪心AI的老師之一。他本人的學術水平自然是非常之高,有多篇頂會論文發表,包括AAAI、KDD等,均可以在dblp等數據庫上查到。李老師講解的非常細致,也非常全面豐富,甚至還會舉一反三地進行講解,明明課后已經有大量的練習題供我們進行練習了,但是李老師在上課的時候也能做到生動有趣,而不是像我大學時候的很多老師一樣照著PPT念知識點,照本宣科,讓我覺得非常痛苦,還不如自學。所以我大學時代常常翹課去工作室學習,還常常被老師點名(不要學我)。印象很深的是李老師在教機器學習的基礎概念的時候,用了很多類比的方法來講解AUC和ROC,我很容易就理解了這倆是什么意思,以及為什么要用這兩個系數來評價模型優劣性,而我自學的時候也就只能拿著這倆參數直接去用,用sklearn框架直接套用在我的模型代碼里面,沒有理解這倆表示了什么意義,而不理解這兩個參數的意義我就沒法去針對性地優化我的機器學習模型。李老師可以說是我理想中的老師了。
課程配套設施
同時我還注意到,以前我在自學的時候,如果遇到了一個比較有趣的模型,我想去實際地嘗試去搭建這樣的一個模型,我就必須得自己在自己的電腦上去搭建環境。搭建過環境的應該都知道這是一個非常痛苦的過程,不僅python的庫要下載(就算使用清華的鏡像源還是會經常卡斷重下),各個版本要匹配(CUDA和各種各樣的Toolkit要和Tensorflow版本對應,對應不了還難以刪除重下),還要查看自己的顯卡和內存是不是能夠運行部分機器學習的模型,對于一些甚至連顯卡都沒有,只能用CPU來運行機器學習模型的同學來說就非常痛苦了。但是我們在學習貪心AI課程的時候,課后的實踐項目等等都有完整的在線環境可以讓我們去使用,完全不用考慮內存、顯卡等等配置的問題,更不用考慮還需要重新下載python庫的問題,節省了自己電腦的空間,更節省了自己花費在搭建環境上的時間。上文提到的助教甚至也可以幫我查看修改我的代碼中的bug,成功修改過后也能強化我對模型算法的代碼記憶和對這個算法的理解。
總結
貪心AI的機器學習基礎課程讓我重新認識了機器學習這個日后必備的科學技術。無論是貪心AI的課程設計、課程內容的深度和廣度、課程所配備的各項設施(練習題、助教、Playground等)、還有課程的師資力量,都是非常優秀的,我覺得在學習貪心科技課程的同時,也可以搭配一些教材,比如周志華西瓜書或者吳恩達的各類機器學習相關課程等,這樣的話就可以雙管齊下,在結合老師教授的內容的同時也可以再輔助看看書籍,這樣也可以更加深入地了解機器學習,為未來學習和工作打下更堅實的基礎。
總結
以上是生活随笔為你收集整理的我与AI:我的“机器学习”过程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 企业年金退休后怎么领取 是不是打到社保卡
- 下一篇: 基金净值是什么