机器学习如何应用到实际生活和创业中
最近在寫機(jī)器學(xué)習(xí)的白話系列主題文章,突然有人問(wèn)我,機(jī)器學(xué)習(xí)到底有什么用,如何才能用到實(shí)際生活中。我覺得很有必要停下腳步,來(lái)認(rèn)真思考一下這個(gè)問(wèn)題:機(jī)器學(xué)習(xí),包括深度學(xué)習(xí),自然語(yǔ)言處理,如何真正應(yīng)用到實(shí)際生活中去。希望大家能夠踴躍討論。
說(shuō)到機(jī)器學(xué)習(xí),最出名的無(wú)非就是Google的AlphaGo這樣的項(xiàng)目,機(jī)器在人類傳統(tǒng)的智力游戲中,無(wú)情而殘酷的戰(zhàn)勝了人類。當(dāng)然,對(duì)于大部分正在讀這篇文章的你來(lái)說(shuō),對(duì)于大部分正在學(xué)習(xí)機(jī)器學(xué)習(xí)的人來(lái)說(shuō),那只是一個(gè)終極目標(biāo)。支撐著AlphaGo的服務(wù)器資源和海量數(shù)據(jù)不是任何機(jī)構(gòu)可以獲得的。
在沒有大量數(shù)據(jù)資源和服務(wù)器資源的情況下,機(jī)器學(xué)習(xí)到底可以怎么應(yīng)用到生活中呢?
隨著Tensorflow的發(fā)布,其實(shí)我們已經(jīng)可以在手機(jī)程序中使用人工智能了,下面的圖就是Tensorflow通過(guò)ImageNet進(jìn)行圖像識(shí)別的例子。
當(dāng)然,圖像識(shí)別只是一個(gè)基礎(chǔ)功能,如何使得圖像識(shí)別應(yīng)用在實(shí)際生活中,則是一個(gè)需要研究的課題。同時(shí),由于手機(jī)這樣的設(shè)備,運(yùn)算能力有限,精度不是很高的情況下,如何滿足實(shí)際需要,也是一個(gè)課題。
當(dāng)然,如果你懂一些硬件的話,也可以和樹莓派一起做一個(gè)智能硬件,做一個(gè)小車到處逛,順便執(zhí)行一些簡(jiǎn)單的任務(wù)。
http://www.leiphone.com/news/201703/2MCSRGD5XpPNbK8c.html
機(jī)器學(xué)習(xí),一般來(lái)說(shuō),能做的事情,一種是分類任務(wù),一種是回歸任務(wù)。
分類的話,在Tensorflow發(fā)布的時(shí)候,日本有個(gè)大叔做了一個(gè)智能黃瓜分類器,將原本農(nóng)作物的分類分揀工作,交給了機(jī)器去完成。但是我看了一下,除了垃圾分類之外,暫時(shí)也沒有什么需要我們?nèi)シ诸惖臇|西。當(dāng)然,如果能夠做到機(jī)器學(xué)習(xí)的自動(dòng)垃圾分類,也是一個(gè)好的主意,做一個(gè)智能垃圾回收站。
http://www.infoq.com/cn/news/2016/09/tensorflow-cucumbers
如果你的工作有需要分類的任務(wù),而且對(duì)于結(jié)果精度要求不高,則可以嘗試一下,例如茶葉的分揀。
做HR的或許可以將簡(jiǎn)歷信息和最后錄取情況作為數(shù)據(jù),訓(xùn)練出一個(gè)簡(jiǎn)歷篩選的工具,幫助降低工作強(qiáng)度,當(dāng)然也可能導(dǎo)致自己失業(yè)。
說(shuō)到回歸任務(wù),也就是預(yù)測(cè)。說(shuō)到預(yù)測(cè),呵呵,股票預(yù)測(cè)。
股票預(yù)測(cè)到底靠不靠譜,我覺得,中國(guó)股市是一個(gè)政策導(dǎo)向的市場(chǎng),這種市場(chǎng)的預(yù)測(cè)基本沒戲。
其他預(yù)測(cè),我也暫時(shí)沒有想到什么好的項(xiàng)目。原因就是,找到帶有標(biāo)簽的大量數(shù)據(jù)源是一件成本非常高的事情。用爬蟲去抓取數(shù)據(jù),然后進(jìn)行標(biāo)簽的整理,也是相當(dāng)耗時(shí)間的事情。
真的要用好機(jī)器學(xué)習(xí),在這個(gè)框架泛濫的時(shí)代,可能領(lǐng)域?qū)<冶葯C(jī)器學(xué)習(xí)專家更加重要。Keras這樣的框架,如果加上一個(gè)可視化的UI,普通人都可以做神經(jīng)網(wǎng)絡(luò)了。
自然語(yǔ)言處理,也是機(jī)器學(xué)習(xí)的一個(gè)分支。大致有兩種模型,一個(gè)是LDA主題模型。一個(gè)是情感分析模型。
實(shí)際生活中的應(yīng)用,一般也就是抓取各種點(diǎn)評(píng)文字,然后通過(guò)點(diǎn)評(píng)分值,歸納出分值和文字之間的特征。我遇到過(guò)一個(gè)項(xiàng)目,是金融業(yè)的。金融網(wǎng)站會(huì)有各種行業(yè)里面的針對(duì)公司的新聞(相當(dāng)于數(shù)據(jù)),證券公司會(huì)有對(duì)于公司股票級(jí)別的評(píng)定(買入,持有,賣出,相當(dāng)于標(biāo)簽),然后將歷年的新聞和評(píng)級(jí)收集起來(lái),做成一個(gè)新聞VS評(píng)級(jí)的模型(輸入新聞,輸出評(píng)級(jí))。有了這個(gè)模型之后,通過(guò)爬蟲去抓取實(shí)時(shí)新聞,計(jì)算出新聞中出現(xiàn)的公司可能出現(xiàn)的股票評(píng)級(jí)變化情況,推送通知相關(guān)客戶。這個(gè)項(xiàng)目的效果還不知道,或許沒有什么實(shí)際價(jià)值。
現(xiàn)在流行創(chuàng)業(yè),很多人,包括我在內(nèi),也希望抓住機(jī)器學(xué)習(xí)這個(gè)風(fēng)口,做一個(gè)創(chuàng)業(yè)項(xiàng)目。我也深深知道,其實(shí)當(dāng)今資本時(shí)代,技術(shù)的地位沒有那么重要了。除非能夠潛心研究一個(gè)高大上,無(wú)法被抄襲的東西出來(lái)。機(jī)器學(xué)習(xí)的核心價(jià)值,是大數(shù)據(jù)和模型。如果有機(jī)會(huì)拿到一些很有價(jià)值的,稀缺性的數(shù)據(jù),然后訓(xùn)練,調(diào)整出一個(gè)高精度的模型,則就離成功很近了。高價(jià)值,沒有被人利用的數(shù)據(jù)在哪?能夠訓(xùn)練出什么獨(dú)特的模型,解決實(shí)際的問(wèn)題?找到問(wèn)題的答案,這個(gè)是關(guān)鍵。
關(guān)注公眾號(hào) TensorFlow教室 深度學(xué)習(xí),機(jī)器學(xué)習(xí),自然語(yǔ)言處理。
總結(jié)
以上是生活随笔為你收集整理的机器学习如何应用到实际生活和创业中的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 教辅的组成
- 下一篇: 全新的 flow.ci Dashboar