數(shù)據(jù)科學(xué)、大數(shù)據(jù)和物聯(lián)網(wǎng)正在以令人炫目的速度發(fā)展和演進(jìn),而商業(yè)界正以緩慢的速度將更多來(lái)自不同渠道的數(shù)據(jù)整合起來(lái),并能從中洞察更多信息。本文是 Andrew Dipper 對(duì)數(shù)據(jù)科學(xué)行業(yè)2017年的展望,并列舉了四大重要趨勢(shì)。
大數(shù)據(jù)技術(shù)的崛起
在過(guò)去一年,我們已經(jīng)見(jiàn)證了大數(shù)據(jù)技術(shù)驚人的成長(zhǎng),但隨著大數(shù)據(jù)技術(shù)在企業(yè)界中被廣泛接受,下一年留給大數(shù)據(jù)技術(shù)的預(yù)算會(huì)快速增加。大多數(shù)企業(yè)已經(jīng)確認(rèn)需要在業(yè)務(wù)的數(shù)據(jù)方向上進(jìn)行改進(jìn),這轉(zhuǎn)而會(huì)需要更多的數(shù)據(jù)科學(xué)家來(lái)處理企業(yè)需要檢索的大量額外數(shù)據(jù)。
如果你在追求一份數(shù)據(jù)科學(xué)領(lǐng)域的職業(yè),那么有關(guān)大數(shù)據(jù)和數(shù)據(jù)框架的知識(shí)是必備的。你可以特別注意一下以下幾個(gè)平臺(tái):Apache Hadoop, HDFS, Hbase, Spark, Storm, Solr 和 Kafka。
數(shù)據(jù)科學(xué)從業(yè)資格的變化
雖然 Elon Musk認(rèn)為機(jī)器學(xué)習(xí)正在“召喚惡魔”,但是它仍將繼續(xù)發(fā)展。Amazon, Facebook 和 Google都在最近幾年加入到了人工智能的競(jìng)賽中。在2017年,越來(lái)越多的企業(yè)會(huì)招募最頂尖的機(jī)器學(xué)習(xí)數(shù)據(jù)科學(xué)家。
但同時(shí),工作崗位的競(jìng)爭(zhēng)也變得更加激烈。在越來(lái)越多的大學(xué)將 AI 列入課程要求的背景下,從2017年開(kāi)始,機(jī)器學(xué)習(xí)會(huì)成為數(shù)據(jù)科學(xué)行業(yè)入門(mén)的必備條件。如果你想在競(jìng)爭(zhēng)中取得先機(jī),有不少的AI和機(jī)器學(xué)習(xí)的認(rèn)證課程供你選擇。雖然有一些課程的價(jià)格達(dá)到1萬(wàn)美元,不過(guò)在 Coursera 或者 edX 上也有為數(shù)不少免費(fèi)或低價(jià)的培訓(xùn)課程。
如果你擁有很強(qiáng)的科技和編程能力,也能夠幫助你在數(shù)據(jù)科學(xué)領(lǐng)域獲得一席之地,尤其是 R 和 Python 語(yǔ)言。同時(shí),SAS 和 MATLAB 的經(jīng)驗(yàn)自然也是加分項(xiàng)。
而且,你需要能夠自如地使用關(guān)系型數(shù)據(jù)庫(kù),所以SQL也是一項(xiàng)非常重要的技能。在2015年一項(xiàng)綜合了 3500 個(gè) linkedin 招聘廣告的研究中,SQL被列為最重要的技能。另外,Hadoop, Python和 Java 也同樣流行。
物聯(lián)網(wǎng)和數(shù)據(jù)科學(xué)的融合
雖然存在一些關(guān)鍵的不同點(diǎn),但是數(shù)據(jù)科學(xué)和物聯(lián)網(wǎng)經(jīng)常被視為一個(gè)硬幣的兩面。數(shù)據(jù)科學(xué)家會(huì)更多地需要從設(shè)備中讀取實(shí)時(shí)數(shù)據(jù),進(jìn)行復(fù)雜的分析或以此作出決策。在這樣的背景下,這兩個(gè)行業(yè)在明年將會(huì)有更深的融合。
在現(xiàn)實(shí)世界中,這一切是怎么實(shí)現(xiàn)的? 想象一下這樣的情景:在不遠(yuǎn)的將來(lái),你不再需要鑰匙來(lái)打開(kāi)你家的大門(mén)。當(dāng)你走向大門(mén)的時(shí)候,它會(huì)感知到你并且自動(dòng)為你打開(kāi)門(mén)鎖。當(dāng)你離開(kāi)家的那一刻,智能家庭會(huì)關(guān)閉所有非必需的耗能設(shè)備,來(lái)為房主節(jié)省花費(fèi)。
這樣的情景好像只能在星際迷航的“企業(yè)號(hào)”上才能見(jiàn)到,但是我們應(yīng)該會(huì)在2017年就能看到雛形,因此,你需要確保你有足夠的技能參與到這樣的項(xiàng)目中去。
同 AI 一樣,為物聯(lián)網(wǎng)服務(wù)的數(shù)據(jù)科學(xué)會(huì)要求你可以自如地使用各種設(shè)備的 RIL(無(wú)線界面層),進(jìn)行邊緣數(shù)據(jù)處理,數(shù)據(jù)處理和深度學(xué)習(xí)。
數(shù)據(jù)科學(xué)驅(qū)動(dòng)的醫(yī)療保健行業(yè)
在改善流行病結(jié)果和預(yù)測(cè)病人行為方面,數(shù)據(jù)科學(xué)已經(jīng)證明了它的價(jià)值。
在2015年,數(shù)據(jù)科學(xué)家?guī)椭A(yù)測(cè)了西尼羅河病毒在美國(guó)的進(jìn)一步爆發(fā),準(zhǔn)確率高達(dá)85%。
在2016年早些時(shí)候,一個(gè)科學(xué)家團(tuán)隊(duì)開(kāi)發(fā)了一套可以預(yù)測(cè)蝙蝠攜帶埃博拉病毒幾率的模型。
在這樣的背景下,2017年內(nèi)我們可以期待數(shù)據(jù)科學(xué)在醫(yī)療保健行業(yè)方面取得長(zhǎng)足的發(fā)展。
隨著電子醫(yī)療保健檔案應(yīng)用的崛起,可以為我們所用的數(shù)據(jù)量已經(jīng)達(dá)到了歷史最高水平。雖然大量的數(shù)據(jù)同時(shí)具有好處和不足,但在2017年,還有很多獲利機(jī)會(huì)留給那些嘗試解碼這些數(shù)據(jù)的科學(xué)家們。如果你正在尋求加入一個(gè)新興領(lǐng)域的話(huà),數(shù)據(jù)科學(xué)是一個(gè)很好的機(jī)會(huì)。
筆者對(duì)未來(lái)醫(yī)療及物聯(lián)網(wǎng)都有涉獵和關(guān)注,我們也相信數(shù)據(jù)科學(xué)將會(huì)發(fā)揮重要的作用。而在 2017 年,我們又會(huì)迎來(lái)怎樣的新變化呢?
來(lái)源:雷鋒網(wǎng)