信息技術(shù)的進(jìn)步改變了所有行業(yè)和研究領(lǐng)域的游戲規(guī)則。
自工業(yè)化開(kāi)始以來(lái),人們一直在分析企業(yè)產(chǎn)生的信息,以幫助做出明智的決策。統(tǒng)計(jì)和數(shù)學(xué)方法在醫(yī)學(xué)、公共政策、農(nóng)業(yè)等領(lǐng)域也很流行。
即使底層方法和工具相同,這種數(shù)據(jù)科學(xué)也會(huì)根據(jù)其應(yīng)用地點(diǎn)和用途而具有不同的內(nèi)涵。
為什么要學(xué)習(xí)數(shù)據(jù)科學(xué)?
我們生活在數(shù)據(jù)洪流時(shí)代,數(shù)據(jù)洪流是指當(dāng)今世界每天每時(shí)每刻產(chǎn)生、發(fā)布或發(fā)布的大量數(shù)據(jù)和信息所導(dǎo)致的信息爆炸。如此豐富的數(shù)據(jù)既可能帶來(lái)好處,也可能帶來(lái)壞處,具體取決于數(shù)據(jù)的使用方式。
我們周圍的一切都是數(shù)據(jù),或者可以使用編程語(yǔ)言進(jìn)行編碼來(lái)表示數(shù)據(jù)。從數(shù)據(jù)中提取這種價(jià)值是數(shù)據(jù)科學(xué)的關(guān)鍵任務(wù)。我們應(yīng)該學(xué)習(xí)數(shù)據(jù)科學(xué),因?yàn)楝F(xiàn)今,無(wú)論在哪個(gè)領(lǐng)域工作,都可以通過(guò)使用數(shù)據(jù)分析方法補(bǔ)充個(gè)人決策,從而增強(qiáng)對(duì)特定練習(xí)的理解和結(jié)果。
數(shù)據(jù)科學(xué)的應(yīng)用
以下是數(shù)據(jù)科學(xué)正在使用的一些領(lǐng)域:
欺詐和風(fēng)險(xiǎn)檢測(cè)
許多欺詐檢測(cè)系統(tǒng)使用數(shù)據(jù)科學(xué)來(lái)了解不當(dāng)行為是如何發(fā)生的,并使用這些數(shù)據(jù)來(lái)檢測(cè)以后的任何惡意活動(dòng)。風(fēng)險(xiǎn)和欺詐檢測(cè)是數(shù)據(jù)科學(xué)最常見(jiàn)的應(yīng)用之一,從數(shù)據(jù)科學(xué)開(kāi)始就很容易完成項(xiàng)目。
醫(yī)療保健
數(shù)據(jù)科學(xué)可用于檢測(cè)危及生命的疾病,例如癌癥、艾滋病、自身免疫性疾病等。這一應(yīng)用在全世界范圍內(nèi)挽救了無(wú)數(shù)生命,因?yàn)榇蠖鄶?shù)疾病如果能及早發(fā)現(xiàn),就可以得到控制。
互聯(lián)網(wǎng)搜索
當(dāng)運(yùn)行Google搜索或使用任何其他搜索引擎時(shí),將在第一個(gè)選項(xiàng)卡中看到的主題取決于兩件事。
搜索引擎優(yōu)化
相關(guān)性
這種相關(guān)性是通過(guò)搜索這些網(wǎng)站的人口統(tǒng)計(jì)數(shù)據(jù),以及人們最有可能留在其中的數(shù)據(jù)來(lái)發(fā)現(xiàn)的。
有針對(duì)性的廣告
廣告推薦、電影推薦以及我們?cè)诨ヂ?lián)網(wǎng)上獲得的任何推薦都?xì)w功于數(shù)據(jù)科學(xué)。企業(yè)使用數(shù)據(jù)科學(xué)來(lái)分析個(gè)人搜索歷史,并根據(jù)其分析對(duì)個(gè)人感興趣的內(nèi)容來(lái)營(yíng)銷產(chǎn)品和服務(wù)。
網(wǎng)站推薦
有時(shí),我們會(huì)在微博上獲得鏈接,或者當(dāng)研究某些內(nèi)容時(shí),會(huì)被推薦某些網(wǎng)站。這一切都要?dú)w功于數(shù)據(jù)科學(xué)。
先進(jìn)的圖像識(shí)別
如今的移動(dòng)設(shè)備都具有人臉識(shí)別功能。這項(xiàng)技術(shù)使用數(shù)據(jù)科學(xué)和神經(jīng)網(wǎng)絡(luò)的組合系統(tǒng)來(lái)繪制人的特征,并識(shí)別人的臉部或正在進(jìn)行的任何與圖像相關(guān)的搜索。這將不允許除本人之外的任何人訪問(wèn)設(shè)備。
語(yǔ)音識(shí)別
Google Assistant、Alexa和Siri等電子助手可以通過(guò)識(shí)別聲音來(lái)回復(fù)命令。
航線規(guī)劃
找到最適合飛機(jī)到達(dá)目的地的路線需要大量工作。必須考慮許多因素,例如給定時(shí)間在所選航線上飛行的航班、航空時(shí)的空中交通以及當(dāng)前飛行的所有飛機(jī)的高度。所有這些都是數(shù)據(jù)集形式;因此,數(shù)據(jù)科學(xué)使規(guī)劃航線變得容易。
游戲
將控制器的動(dòng)作映射到游戲的動(dòng)作也是數(shù)據(jù)科學(xué)的神奇之處。
增強(qiáng)現(xiàn)實(shí)
在增強(qiáng)現(xiàn)實(shí)中使用數(shù)據(jù)科學(xué)可以允許多個(gè)用戶跟蹤神經(jīng)網(wǎng)絡(luò),并確保機(jī)器運(yùn)行良好。
數(shù)據(jù)科學(xué)家的角色和職責(zé)是什么?
數(shù)據(jù)科學(xué)家應(yīng)該與業(yè)務(wù)利益相關(guān)者密切合作,以理解其目標(biāo),并定義數(shù)據(jù)如何實(shí)現(xiàn)這些目標(biāo)。設(shè)計(jì)數(shù)據(jù)建模技術(shù)創(chuàng)建算法和預(yù)測(cè)模型,以將數(shù)據(jù)從業(yè)務(wù)需求中刪除,并幫助分析數(shù)據(jù)并與對(duì)等方共享智慧。
雖然每個(gè)項(xiàng)目都是不同的,但收集和解釋數(shù)據(jù)的方法通常遵循以下方式:
提出一些值得尊重的問(wèn)題來(lái)開(kāi)始發(fā)現(xiàn)過(guò)程
接收數(shù)據(jù)
處理和清理數(shù)據(jù)
合并并存儲(chǔ)數(shù)據(jù)
初始數(shù)據(jù)分析和實(shí)驗(yàn)數(shù)據(jù)分析
選擇一種或多種可能的模型和算法
使用數(shù)據(jù)科學(xué)方法,例如機(jī)器學(xué)習(xí)、統(tǒng)計(jì)建模和人工智能
估計(jì)和增強(qiáng)結(jié)果
向利益相關(guān)者呈現(xiàn)結(jié)論性結(jié)果
根據(jù)反饋進(jìn)行調(diào)整
重復(fù)解決新問(wèn)題的方法