一、專業(yè)解析
什么是大數(shù)據(jù)?
進(jìn)入互聯(lián)網(wǎng)時(shí)代,中國的網(wǎng)民人數(shù)已超7億,大數(shù)據(jù)的應(yīng)用涉及到生活的方方面面。例如,你在網(wǎng)站上買書,商家就會(huì)根據(jù)你的喜好和其他購書者的評(píng)價(jià)給你推薦另外的書籍;手機(jī)定位數(shù)據(jù)和交通數(shù)據(jù)可以幫助城市規(guī)劃;甚至用戶的搜索習(xí)慣和股市都有很大關(guān)系。
在談到大數(shù)據(jù)的時(shí)候,人們往往知道的就是數(shù)據(jù)很大,但大數(shù)據(jù)≠大的數(shù)據(jù)。對外經(jīng)濟(jì)貿(mào)易大學(xué)信息學(xué)院副院長華迎教授介紹:“現(xiàn)在的大數(shù)據(jù)包括來自于多種渠道的多類數(shù)據(jù),其中主要來源網(wǎng)絡(luò)數(shù)據(jù)。數(shù)據(jù)分析不是新的,一直都有,但是為什么叫大數(shù)據(jù)呢?主要是因?yàn)榫W(wǎng)絡(luò)數(shù)據(jù)的格式、體量、價(jià)值,都超出了傳統(tǒng)數(shù)據(jù)的規(guī)模。對這些海量信息的采集、存儲(chǔ)、分析、整合、控制而得到的數(shù)據(jù)就是大數(shù)據(jù)。大數(shù)據(jù)技術(shù)的意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些數(shù)據(jù)進(jìn)行專業(yè)化處理,通過‘加工’實(shí)現(xiàn)數(shù)據(jù)的‘增值’,更好地輔助決策?!?/p>
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)
本科專業(yè)中和大數(shù)據(jù)相對應(yīng)的是“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè),它是2015年教育部公布的新增專業(yè)。2016年3月公布的《高校本科專業(yè)備案和審批結(jié)果》中,北京大學(xué)、對外經(jīng)濟(jì)貿(mào)易大學(xué)和中南大學(xué)3所高校首批獲批開設(shè)“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)。隨后第二年又有32所高校獲批“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)。兩次獲批的名單中顯示,該專業(yè)學(xué)制為四年,大部分為工學(xué)。
“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)是個(gè)交叉性很強(qiáng)的專業(yè),很難說完全歸屬于哪個(gè)獨(dú)立的學(xué)科。所以,不同的學(xué)校有的是信息學(xué)院申報(bào),有的是計(jì)算機(jī)學(xué)院牽頭申報(bào),有的設(shè)在統(tǒng)計(jì)學(xué)院,還有的在經(jīng)管學(xué)院。像北京大學(xué)這個(gè)專業(yè)是放在理學(xué)下,授予理學(xué)學(xué)位。大多數(shù)是設(shè)在工學(xué)計(jì)算機(jī)門類下,授予的是工學(xué)學(xué)位。”華迎教授說:“數(shù)據(jù)科學(xué)很早就存在,是個(gè)比較經(jīng)典的學(xué)科,現(xiàn)在和大數(shù)據(jù)技術(shù)結(jié)合形成了這個(gè)專業(yè)。目前教育部設(shè)定的本科專業(yè)名稱為‘?dāng)?shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)’,??泼Q是‘大數(shù)據(jù)技術(shù)與應(yīng)用’?!?/p>
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)學(xué)什么?
以對外經(jīng)濟(jì)貿(mào)易大學(xué)該專業(yè)為例,專業(yè)知識(shí)結(jié)構(gòu)包括數(shù)學(xué)、統(tǒng)計(jì)、計(jì)算機(jī)和大數(shù)據(jù)分析四大模塊,具體課程設(shè)置如下:
數(shù)學(xué):數(shù)學(xué)分析一、數(shù)學(xué)分析二、高等代數(shù)、離散數(shù)學(xué)。統(tǒng)計(jì)學(xué):概率論與數(shù)理統(tǒng)計(jì)、多元統(tǒng)計(jì)分析、隨機(jī)過程。計(jì)算機(jī):數(shù)據(jù)結(jié)構(gòu)、計(jì)算機(jī)組成原理、操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)原理、C++程序設(shè)計(jì)、Java程序設(shè)計(jì)、Python與大數(shù)據(jù)分析、科學(xué)計(jì)算與Matlab應(yīng)用、R語言等。大數(shù)據(jù)分析:數(shù)據(jù)科學(xué)導(dǎo)論、機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘、信息檢索與數(shù)據(jù)處理、自然語言處理、智能計(jì)算、推薦系統(tǒng)原理、大數(shù)據(jù)分析技術(shù)基礎(chǔ)、數(shù)據(jù)可視化、大數(shù)據(jù)存儲(chǔ)與管理、大數(shù)據(jù)分析實(shí)踐等課程。
華迎教授介紹:“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)是一門實(shí)踐性很強(qiáng)的新興交叉復(fù)合型學(xué)科,無論是開設(shè)在哪個(gè)學(xué)院下,數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)三大塊課程是必須得有。各高校在這幾門背景學(xué)科的基礎(chǔ)上,交叉融合其他的專業(yè)知識(shí)技能。如我校在數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)知識(shí)體系模塊中又增加了體現(xiàn)學(xué)校特色的財(cái)經(jīng)類行業(yè)應(yīng)用和外語模塊,以提升學(xué)生的行業(yè)應(yīng)用能力和國際化水平。根據(jù)各校偏重的專業(yè)方向,課程設(shè)置有所差異,感興趣的同學(xué)可以具體查看各校的專業(yè)和課程設(shè)置情況?!?/p>
二、專業(yè)與就業(yè)
行業(yè)增速快 人才缺口180萬
隨著移動(dòng)互聯(lián)網(wǎng)和智能終端的普及,信息技術(shù)與經(jīng)濟(jì)社會(huì)的交匯融合,引發(fā)了數(shù)據(jù)迅猛增長。新摩爾定律認(rèn)為,人類有史以來的數(shù)據(jù)總量,每過18個(gè)月就會(huì)翻一番。而海量的數(shù)據(jù)蘊(yùn)含著巨大生產(chǎn)力和商機(jī)。
2011年至2014年四年間,我國大數(shù)據(jù)處于起步階段,每年均增長在20%以上。2015年,大數(shù)據(jù)市場規(guī)模已達(dá)到98.9億元。2016年增速達(dá)到45%,超過160億元。預(yù)計(jì)2020年,我國大數(shù)據(jù)市場規(guī)模將超過8000億元,有望成世界第一數(shù)據(jù)資源大國。但數(shù)據(jù)開放度低、技術(shù)薄弱、人才缺失、行業(yè)應(yīng)用不深入等都是產(chǎn)業(yè)發(fā)展中亟待解決的問題。
根據(jù)領(lǐng)英發(fā)布《2016年中國最熱職位人才報(bào)告》顯示,有六類熱門職位的人才當(dāng)前都處于供不應(yīng)求狀態(tài),稀缺程度各有不同,其中,數(shù)據(jù)分析人才的供給指數(shù)最低,僅為0.05,屬于高度稀缺。
中國商業(yè)聯(lián)合會(huì)數(shù)據(jù)分析專業(yè)委員會(huì)資料顯示,未來3至5年,中國需要180萬數(shù)據(jù)人才,但截至目前,中國大數(shù)據(jù)從業(yè)人員只有約30萬人。同時(shí),大數(shù)據(jù)行業(yè)選才的標(biāo)準(zhǔn)也在不斷變化。初期,大數(shù)據(jù)人才的需求主要集中在ETL研發(fā)、系統(tǒng)架構(gòu)開發(fā)、數(shù)據(jù)倉庫研究等偏硬件領(lǐng)域,以IT、計(jì)算機(jī)背景的人才居多。隨著大數(shù)據(jù)往各垂直領(lǐng)域延伸發(fā)展,對統(tǒng)計(jì)學(xué)、數(shù)學(xué)專業(yè)的人才,數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智能等偏軟件領(lǐng)域的需求加大。
大數(shù)據(jù)主要就業(yè)方向
2015年9月國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,系統(tǒng)部署大數(shù)據(jù)發(fā)展工作?!毒V要》明確提出了七方面政策機(jī)制,其中第六條就是加強(qiáng)專業(yè)人才培養(yǎng),建立健全多層次、多類型的大數(shù)據(jù)人才培養(yǎng)體系。目前,大數(shù)據(jù)主要有三大就業(yè)方向:大數(shù)據(jù)系統(tǒng)研發(fā)類、大數(shù)據(jù)應(yīng)用開發(fā)類和大數(shù)據(jù)分析類。具體崗位如:大數(shù)據(jù)分析師、大數(shù)據(jù)工程師等。
“大數(shù)據(jù)分析師是用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對收集來的大量數(shù)據(jù)進(jìn)行分析,強(qiáng)調(diào)的是數(shù)據(jù)的應(yīng)用,側(cè)重于統(tǒng)計(jì)層面內(nèi)容會(huì)多一些。比如做產(chǎn)品經(jīng)理,可以通過數(shù)據(jù)建立金融模型,來推出一些理財(cái)產(chǎn)品。而大數(shù)據(jù)工程師則側(cè)重于技術(shù),主要是圍繞大數(shù)據(jù)平臺(tái)系統(tǒng)級(jí)的研發(fā),偏開發(fā)層面?!比A迎教授介紹:“我們把大數(shù)據(jù)分析在業(yè)務(wù)中使用的流程總結(jié)起來,分為以下幾個(gè)步驟:數(shù)據(jù)獲取和預(yù)處理、數(shù)據(jù)存儲(chǔ)管理、數(shù)據(jù)分析建模、數(shù)據(jù)可視化。在這個(gè)應(yīng)用流程中,畢業(yè)生可以根據(jù)自己的興趣和特長,在不同的環(huán)節(jié)選擇就業(yè)。”