人工智能早已婦孺皆知,其熱度仍然居高不下,其發(fā)展前景亦是被很多大佬看好,于是很多小伙伴們都想進(jìn)人工智能領(lǐng)域,投入 AI的懷抱,但苦于不知如何下手、如何學(xué)習(xí)AI。其中,人工智能的核心就是機(jī)器學(xué)習(xí)(MachineLearning),它是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。
今天云和數(shù)據(jù)的小編就來(lái)分享一些來(lái)自 EliteDataScience 上專門講給機(jī)器學(xué)習(xí)入門自學(xué)者的心得體會(huì),告訴你在機(jī)器學(xué)習(xí)之路上的幾個(gè)重要步驟:
1.什么是機(jī)器學(xué)習(xí)?
在悶頭學(xué)習(xí)機(jī)器學(xué)習(xí)之前,最好先把什么是機(jī)器學(xué)習(xí)搞清楚,了解機(jī)器學(xué)習(xí)的基本概念。
簡(jiǎn)單來(lái)說(shuō),機(jī)器學(xué)習(xí)就是教電腦怎樣從數(shù)據(jù)中學(xué)習(xí),然后做出決策或預(yù)測(cè)。對(duì)于真正的機(jī)器學(xué)習(xí)來(lái)說(shuō),電腦必須在沒(méi)有明確編程的情況下能夠?qū)W習(xí)識(shí)別模型。
機(jī)器學(xué)習(xí)屬于計(jì)算機(jī)科學(xué)與統(tǒng)計(jì)學(xué)的交叉學(xué)科,在多個(gè)領(lǐng)域會(huì)以不同的面目出現(xiàn),比如你應(yīng)該聽過(guò)這些名詞:數(shù)據(jù)科學(xué)、大數(shù)據(jù)、人工智能、預(yù)測(cè)型分析、計(jì)算機(jī)統(tǒng)計(jì)、數(shù)據(jù)挖掘······
雖然機(jī)器學(xué)習(xí)和這些領(lǐng)域有很多重疊的地方,但也不能將它們混淆。例如,機(jī)器學(xué)習(xí)是數(shù)據(jù)科學(xué)中的一種工具,也能用于處理大數(shù)據(jù)。
機(jī)器學(xué)習(xí)自身也分為多個(gè)類型,比如監(jiān)督式學(xué)習(xí)、非監(jiān)督式學(xué)習(xí)、增強(qiáng)學(xué)習(xí)等等。例如:
郵件運(yùn)營(yíng)商將垃圾廣告信息分類至垃圾箱,應(yīng)用的是機(jī)器學(xué)習(xí)中的監(jiān)督式學(xué)習(xí);電商公司通過(guò)分析消費(fèi)數(shù)據(jù)將消費(fèi)者進(jìn)行分類,應(yīng)用的是機(jī)器學(xué)習(xí)中的非監(jiān)督式學(xué)習(xí);而無(wú)人駕駛汽車中的電腦和攝像頭與道路及其它車輛交互、學(xué)習(xí)如何導(dǎo)航,就是用到了增強(qiáng)學(xué)習(xí)。
2.需要預(yù)備哪些知識(shí)?
如果沒(méi)有基本的知識(shí)儲(chǔ)備,機(jī)器學(xué)習(xí)的確看起來(lái)很嚇人。要學(xué)習(xí)機(jī)器學(xué)習(xí),你不必是專業(yè)的數(shù)學(xué)人才,或者程序員大牛,但你確實(shí)需要掌握這些方面的核心技能。
好消息是,一旦完成預(yù)備知識(shí),剩下的部分就相當(dāng)容易啦。實(shí)際上,機(jī)器學(xué)習(xí)基本就是將統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)中的概念應(yīng)用在數(shù)據(jù)上。
這一步的基本任務(wù)就是保證自己在編程和統(tǒng)計(jì)學(xué)知識(shí)上別掉隊(duì),機(jī)器學(xué)習(xí)的預(yù)備知識(shí)主要有以下三個(gè)方面
1)如果不懂編程,是沒(méi)法使用機(jī)器學(xué)習(xí)的。應(yīng)用于數(shù)據(jù)科學(xué)中的Python語(yǔ)言是一個(gè)很好的選擇
2)了解統(tǒng)計(jì)學(xué)知識(shí),特別是貝葉斯概率,對(duì)于許多機(jī)器學(xué)習(xí)算法來(lái)說(shuō)都是基本的要求。
3)研究機(jī)器學(xué)習(xí)算法需要一定的線性代數(shù)和多元微積分知識(shí)作為基礎(chǔ)。
3. 原理知識(shí)重要嗎?
盡可能多地吸收機(jī)器學(xué)習(xí)的原理和知識(shí),這一步和第一步有些相似,但不同的是,第一步是對(duì)機(jī)器學(xué)習(xí)有個(gè)初步了解,而這一步是要掌握相關(guān)原理知識(shí)。
可能有些朋友會(huì)想:我又不想做基礎(chǔ)研究,干嘛要掌握這些原理,只要會(huì)用機(jī)器學(xué)習(xí)工具包不就行了嗎?
有這個(gè)疑問(wèn)也很正常,但是對(duì)于任何想將機(jī)器學(xué)習(xí)應(yīng)用在工作中的人來(lái)說(shuō),學(xué)習(xí)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)非常重要。比如你在應(yīng)用機(jī)器學(xué)習(xí)中可能會(huì)遇到這些問(wèn)題:
數(shù)據(jù)收集是個(gè)非常耗時(shí)耗力的過(guò)程。你需要考慮:我需要收集什么類型的數(shù)據(jù)?我需要多少數(shù)據(jù)?等此類的問(wèn)題。
數(shù)據(jù)假設(shè)和預(yù)處理。不同的算法需要對(duì)輸入數(shù)據(jù)進(jìn)行不同的假設(shè)。我該怎樣預(yù)處理我的數(shù)據(jù)?我的模型對(duì)缺失的數(shù)據(jù)可靠嗎?
解釋模型結(jié)果。說(shuō)機(jī)器學(xué)習(xí)就是“黑箱”的觀點(diǎn)明顯是錯(cuò)誤的。沒(méi)錯(cuò),不是所有的模型結(jié)果能直接判讀,但你需要能夠判斷模型的狀況,進(jìn)而完善它們。我怎么確定模型是過(guò)度擬合還是不充分?jǐn)M合?模型還有多少改進(jìn)空間?
優(yōu)化和調(diào)試模型。很少有人剛開始就得到一個(gè)最佳模型,你需要了解不同參數(shù)之間的細(xì)微差別和正則化方法。如果我的模型過(guò)度擬合,該怎么修正?我應(yīng)該將幾個(gè)模型組合在一起嗎?
要想在機(jī)器學(xué)習(xí)研究中解答這些問(wèn)題,掌握機(jī)器學(xué)習(xí)的知識(shí)原理必不可少。
4.實(shí)踐出真知
掌握了機(jī)器學(xué)習(xí)的基礎(chǔ)理念知識(shí),接著就該實(shí)際操作了。
實(shí)際操作主要是通過(guò)具體的、深思熟慮的實(shí)踐操作增強(qiáng)你的技能。本步目標(biāo)有三個(gè):
練習(xí)機(jī)器學(xué)習(xí)的整個(gè)流程:收集數(shù)據(jù),預(yù)處理和清理數(shù)據(jù),搭建模型,訓(xùn)練和調(diào)試模型,評(píng)估模型。
在真正的數(shù)據(jù)集上實(shí)踐操作:對(duì)于什么樣的數(shù)據(jù)適合用什么類型的模型,自己應(yīng)逐漸建立這方面的判斷能力。
深度探究:例如在上一步,你學(xué)習(xí)了很多機(jī)器學(xué)習(xí)算法知識(shí),在這一步就要將不同類型的算法應(yīng)用在數(shù)據(jù)集中,看看哪個(gè)效果最好。
完成這一步后,就可以進(jìn)行更大規(guī)模的項(xiàng)目了。
5.項(xiàng)目中持續(xù)成長(zhǎng)
終于到了最后一步,也是很有意思的一步。目前為止,我們已經(jīng)完成了:知識(shí)儲(chǔ)備、掌握基本原理、針對(duì)性練習(xí)等階段,現(xiàn)在我們準(zhǔn)備探究更大的項(xiàng)目:
這一步的目標(biāo)就是練習(xí)將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于完整的端到端分析。
如果你按照這個(gè)步驟一步步扎實(shí)學(xué)習(xí)的話,相信你一定在AI方面學(xué)有所成,好了,已上就是云和數(shù)據(jù)的小編分享的內(nèi)容,希望對(duì)您有所幫助!