作為開源分布式大數(shù)據(jù)計(jì)算平臺(tái)的鼻祖,Hadoop生態(tài)現(xiàn)已提供了一套完整的存儲(chǔ)和計(jì)算體系,也是時(shí)下裝機(jī)量最高的計(jì)算框架,其成熟與豐富基本上可以滿足企業(yè)的大部分應(yīng)用場(chǎng)景;Spark能迎頭追趕Hadoop主要是其解決了一攬子的問題,比如SQL、機(jī)器學(xué)習(xí)、流處理、圖等,而更簡(jiǎn)單的API無疑加速了其追趕速度,此外在一個(gè)內(nèi)存越來越便宜的時(shí)代,基于內(nèi)存帶來的性能提升讓Spark不火都難!Hadoop與Spark,老將與新貴,交相輝映。
盡管企業(yè)、開發(fā)者對(duì)大數(shù)據(jù)有很多的顧慮,但在戰(zhàn)略方向和長遠(yuǎn)發(fā)展來看,大數(shù)據(jù)已經(jīng)成為大家的共識(shí),必須要進(jìn)行投入,可以預(yù)見,全民大數(shù)據(jù)一定會(huì)像全民皆云一樣成為主旋律,投入是必須的操作。而在投入預(yù)算方面,由于對(duì)大數(shù)據(jù)認(rèn)知度的局限、大數(shù)據(jù)產(chǎn)品服務(wù)的不足、市場(chǎng)教育的缺乏,有相當(dāng)一部分的開發(fā)者并不清楚應(yīng)該投入多少才是合理的預(yù)算范圍。
六、人工智能
2016、2017年人工智能成為中國開發(fā)者重點(diǎn)關(guān)注的技術(shù)領(lǐng)域,在中國計(jì)算機(jī)視覺、自然語言處理、語音相關(guān)技術(shù)成為開發(fā)者滲透最廣的三個(gè)AI技術(shù)領(lǐng)域。AI的兩個(gè)重要技術(shù)方向一個(gè)是感知智能、一個(gè)是認(rèn)知智能,認(rèn)知智能的難度要高于感知智能。在這樣的背景下,多數(shù)開發(fā)者選擇相對(duì)容易入手的計(jì)算機(jī)視覺和語音相關(guān)的感知智能領(lǐng)域,作為上手AI的敲門磚。
視覺技術(shù)依然是一個(gè)非常前沿的技術(shù)學(xué)科,對(duì)中國開發(fā)者而言依然有很多障礙需要克服,首當(dāng)其沖的就是算法成熟度問題,其次則是場(chǎng)景的復(fù)雜度過高,數(shù)據(jù)較難收集;而成本問題相比前兩個(gè)問題,似乎對(duì)中國開發(fā)者而言就顯得并不是關(guān)鍵性問題。
算法是視覺技術(shù)的基礎(chǔ),而算法的核心是數(shù)學(xué),因此也就給很多開發(fā)者樹立了天然的門檻,許多頂尖的開發(fā)者如果缺少了頂尖數(shù)學(xué)的能力,很難將難以理解的數(shù)學(xué)邏輯用代碼的形式表達(dá)出來,這個(gè)問題已經(jīng)成為包括中國開發(fā)者在內(nèi)的全球視覺技術(shù)開發(fā)者的共同阻礙。其次則是復(fù)雜場(chǎng)景的數(shù)據(jù)收集問題,盡管中國在傳感器部署方面數(shù)量眾多,但由于數(shù)據(jù)安全性問題,開發(fā)者很難獲取海量公共信息,因此面對(duì)復(fù)雜場(chǎng)景時(shí),只能進(jìn)行有限的數(shù)據(jù)收集,這也成為開發(fā)者應(yīng)用視覺技術(shù)時(shí)的另一個(gè)重要問題。
七、移動(dòng)開發(fā)
中國移動(dòng)化看似美好的繁榮市場(chǎng)下,實(shí)則是一將功成萬骨枯的壯烈。在被調(diào)研的所有移動(dòng)開發(fā)者中,僅有15.8%的開發(fā)者表示對(duì)所開發(fā)的移動(dòng)應(yīng)用盈利情況表示滿意,也就是說超過八成的移動(dòng)應(yīng)用并不能很好的實(shí)現(xiàn)“奔小康”。對(duì)于如何實(shí)現(xiàn)移動(dòng)應(yīng)用的盈利,開發(fā)者們也是各顯神通,目前最有效率的盈利方式是應(yīng)用內(nèi)購買,其次則是電子商務(wù),而傳統(tǒng)的互聯(lián)網(wǎng)廣告、付費(fèi)下載等方式在移動(dòng)端似乎不太靈驗(yàn)。
八、區(qū)塊鏈
中國區(qū)塊鏈的商業(yè)應(yīng)用還處于非常原始的階段,甚至包括全球流行的比特幣服務(wù)也已經(jīng)被叫停。因此在應(yīng)用區(qū)塊鏈服務(wù)方面,多數(shù)的開發(fā)者還處于探索嘗試階段。目前主要使用的場(chǎng)景是利用區(qū)塊鏈技術(shù)實(shí)現(xiàn)信息存證,第二位的是使用資產(chǎn)模型,實(shí)現(xiàn)資產(chǎn)的流動(dòng)與信息檢索,第三位的是關(guān)鍵業(yè)務(wù)的約束上鏈。顯然排名靠前的區(qū)塊鏈服務(wù)核心都是實(shí)現(xiàn)局部或部分關(guān)鍵信息的存證與檢索,為保證信息的真實(shí)有效性而上鏈。
區(qū)塊鏈其服從多數(shù)原則的機(jī)制與隱私的結(jié)合也非常獨(dú)特,50%的開發(fā)者傾向于使用密碼原語+智能合約結(jié)合的方式來實(shí)現(xiàn)隱私與區(qū)塊鏈的結(jié)合,另有42.9%的開發(fā)者認(rèn)為離線交易+平臺(tái)存證更好。而現(xiàn)階段,這兩種方式似乎各有優(yōu)劣,還有待進(jìn)一步的驗(yàn)證。
區(qū)塊鏈畢竟還是非常年輕的新技術(shù),開發(fā)者面臨的問題五花八門,并沒有形成明顯的聚類特征。50%的開發(fā)者認(rèn)為標(biāo)準(zhǔn)是最大的障礙,46.4%開發(fā)者認(rèn)為技術(shù)不成熟才是首要問題,另外有32.1%開發(fā)者表示沒有成功案例參考才是最令人頭疼的問題。可見,現(xiàn)階段要想實(shí)現(xiàn)區(qū)塊鏈的快速發(fā)展,標(biāo)準(zhǔn)、技術(shù)、成功實(shí)踐都是硬傷,而這個(gè)硬傷恐怕短期內(nèi)還難以解決。