欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

歡迎來到云服務器

大數(shù)據(jù)技術

大數(shù)據(jù)可能“說謊” 非結構化數(shù)據(jù)將呈現(xiàn)更豐富的世界

在2017年的下半年談論大數(shù)據(jù)似乎已經沒有什么新意,甚至有些令人生厭了,畢竟這個詞在中國已經流行太久,形形色色的產品、平臺和公司早已貼滿了大數(shù)據(jù)標簽,而真正有價值的創(chuàng)新永遠都是少數(shù)。

行業(yè)對于大數(shù)據(jù)的認知開始變得更加理性和客觀,這是一種成熟的表現(xiàn)。但如果因此就認為大數(shù)據(jù)時代已經進入風平浪靜的“發(fā)展期”,那么我們很可能會錯過一場更加波瀾壯闊的變革。

被忽視的非結構化數(shù)據(jù)

在過去幾年,大數(shù)據(jù)產業(yè)更多關注的是如何處理海量、多源和異構的數(shù)據(jù),并從中獲得價值,而其中絕大多數(shù)都是結構化數(shù)據(jù)。不可否認,這些數(shù)據(jù)的體量足夠巨大,然而我們今天必須承認這些只是冰山一角——行業(yè)公認的數(shù)據(jù)是,結構化數(shù)據(jù)僅占到全部數(shù)據(jù)量的20%,其余80%都是以文件形式存在的非結構化和半結構化數(shù)據(jù),包括各種辦公文檔、圖片、視頻、音頻、設計文檔、日志文件、機器數(shù)據(jù)等,這些數(shù)據(jù)如同“暗網”一般地沉默著??梢韵胂?,如果我們只閱讀了一本書的五分之一,又如何正確理解這本書的含義呢?

大數(shù)據(jù)可能“說謊” 非結構化數(shù)據(jù)將呈現(xiàn)更豐富的世界

非結構化數(shù)據(jù)數(shù)據(jù)總量的80%以上

事實上,過去大家并非有意忽視非結構化數(shù)據(jù),而是受到一些條件的制約和影響,不得不策略性地“放棄”這部分數(shù)據(jù)

1、存儲資源受限,大量數(shù)據(jù)被拋棄

非結構化數(shù)據(jù)體量巨大并且產生速度非常快,需要占用大量的存儲資源,而存儲成本降低也只是最近幾年的事情,大量數(shù)據(jù)還沒有加以分析和利用就被早早拋棄,以便為新產生的數(shù)據(jù)騰出空間;

2、數(shù)據(jù)體量大,獲取和流轉困難

對于已經保留下來的非結構化數(shù)據(jù),真要去使用和處理它,依然是一項不討好的“體力活兒”。由于體量、距離和網速的原因,非結構化數(shù)據(jù)并不容易獲得,更不要說被靈活地放入業(yè)務分析和處理流程之中了;

3、缺乏處理分析的技術手段

非結構化數(shù)據(jù)的價值密度相對較低,缺乏有效的技術對非結構化數(shù)據(jù)進行處理和分析,面對海量文件數(shù)據(jù)束手無策。相比之下,結構化數(shù)據(jù)更容易入手,優(yōu)先處理結構化數(shù)據(jù)也是非常合情合理的。

結構化數(shù)據(jù)的局限性

然而在對結構化數(shù)據(jù)進行分析和挖掘的過程中,我們越來越多地發(fā)現(xiàn)一些新的問題,甚至已經造成很大困擾:

1、結構化數(shù)據(jù)可能在“說謊”

結構化數(shù)據(jù)的優(yōu)點在于便于統(tǒng)計和處理,包括結構化數(shù)據(jù)的形成本身就可能來自于統(tǒng)計。而統(tǒng)計并不能代表全部信息,必然存在一定程度的損耗,并帶來誤導。這也是為什么有些時候明明看似得出了合理的結論,卻不能有效改進我們的業(yè)務。

相比之下,非結構化數(shù)據(jù)則“誠實”得多,通常包含了完整而連續(xù)的信息,其中充滿了大量微小但卻非常關鍵的細節(jié),而這些數(shù)據(jù)將成為我們信息來源的重要組成部分,甚至會起到決定性的作用。

2、僅有結構化數(shù)據(jù)的世界簡直太乏味了

人類先天是感性的生物,我們都喜歡豐富多彩的世界,它應該是立體而全方位的,包含了多種感官的信息和刺激,而不僅僅是枯燥的數(shù)字。很多時候我們發(fā)現(xiàn),無論是從受眾的接受程度還是所傳遞的信息量來看,即便是再酷炫的統(tǒng)計圖表,也抵不過一分鐘生動的視頻。這一點從各大企業(yè)官方網站的變化中,就能明顯地感受到。

另外,值得注意的是,人類對于結構化數(shù)據(jù)的運用由來已久。比如在企業(yè)級市場,包括ERP、CRM、MRP等管理軟件一向都屬于這一范疇,而所謂的大數(shù)據(jù)應用只是一個更高級的階段而已。因此,從實際的技術發(fā)展和應用水平的角度來看,結構化數(shù)據(jù)市場是相當成熟的,也會愈發(fā)平穩(wěn)。比如賽迪在今年5月發(fā)布的一份報告就顯示,以ERP和CRM為代表的結構化數(shù)據(jù)市場增速放緩,相比之下非結構化數(shù)據(jù)市場的代表ECM(企業(yè)內容管理)則表現(xiàn)出強勁的增長動力。我想這也在一定程度上反映了市場的看法和整體的趨勢。

大數(shù)據(jù)可能“說謊” 非結構化數(shù)據(jù)將呈現(xiàn)更豐富的世界

2011-2016年CRM軟件、ERP軟件和ECM軟件市場規(guī)模增速對比

(數(shù)據(jù)來源:CCID,2017.5)

未來世界將是非結構化的

世界隨時都在發(fā)生變化,時至今日,對非結構化數(shù)據(jù)的管理和應用走到了一個重要關口。

一方面得益于存儲成本的下降。隨著存儲技術和公有云平臺的不斷發(fā)展和成熟,域名注冊,用戶可以擁有充足并且彈性可擴展的存儲資源,用于存放更大量的非結構化數(shù)據(jù),從而使得非結構化數(shù)據(jù)的積累和應用成為可能。

大數(shù)據(jù)可能“說謊” 非結構化數(shù)據(jù)將呈現(xiàn)更豐富的世界

Hype Cycle for Storage Technologies,2016,Gartner

騰訊云代理

Copyright © 2003-2021 MFISP.COM. 國外vps服務器租用 夢飛云服務器租用 版權所有 ? 粵ICP備11019662號

主站蜘蛛池模板: 仪征市| 铁力市| 柳林县| 阿尔山市| 富川| 锡林浩特市| 股票| 饶阳县| 湖北省| 九龙县| 安图县| 浦东新区| 杭锦后旗| 容城县| 芒康县| 独山县| 息烽县| 明水县| 琼中| 庆元县| 库车县| 霍邱县| 民勤县| 雷州市| 墨江| 鄂尔多斯市| 泸定县| 盈江县| 循化| 五莲县| 寻甸| 松桃| 景东| 景洪市| 遂溪县| 涟水县| 花莲市| 察哈| 攀枝花市| 长沙县| 博野县|