人們可能聽說過經常引用的一句話,“全球90%的數據都是在過去兩年里創建的。”其原因是通過公眾意識傳遞,使其變成一個“有趣的事實”。如果這句話
是真的,那么全球產生的數據將在未來兩年增長10倍,在未來4年增長100倍。
數據量上升及其持續增長應該是不言而喻的。數據被視為一種資產,它擁有更具價值的信息。大數據導致了新工具和新分析領域的發展(反過來又產生了更多的數據),從中收集到越來越有價值的信息。從經濟角度看,2019年大數據市場規模為490億美元,預計到2023年將增長至1030億美元。而人們應該期待市場力量推動任何可以實現貨幣化商品的增長。
1. 保護資產
“顯而易見的事實”是受到保護的數據資產在增長。 2012年,預計全球產生的數據到2020年將達到40ZB,而最近的一項研究預測,到2025年將達到175ZB。更重要的是,需要保護的數據比例增長速度超過了數字景觀本身,從2010年的不到三分之一增長到2020年的40%。
從社交媒體到數字化轉型再到技術創新,許多因素促成了原始數據的增長。例如,與2D成像的X光圖像相比,3D成像的X光圖像文件大小增加了20倍,并且自動駕駛汽車可能每小時產生3TB數據,或每秒不到1GB。將原始數據轉化為有價值的信息的分析仍處于起步階段。研究表明,僅分析了極少的數據,但大數據的增長數據則引起了人們對數據爆炸性增長的興趣。
如今受到保護的數據只是冰山一角。在原始數據方面,安全性應與IT部門合作,并應首先考慮數據的增長軌跡,以了解數據存儲、歸檔和備份策略。分析不僅會增加數據需求,還會生成更多信息。輸入的內容可能包括客戶隱私和財務數據,其結果既敏感又有價值。應該從數據風險的角度評估和管理分析環境。
2. 動態數據
數據一直在移動,并且這種移動有望繼續。IDC公司2018年發布的一份關于這一主題的白皮書分為三大類描述了數據位置:
核心:核心設施曾經是企業數據中心的專屬區域,而越來越多的核心設施是云平臺(無論是公共云、私有云還是混合云)。預計到2020年,公共云中的數據要比端點中的數據更多,到2021年,公共云中的數據將比傳統數據中心中的數據更多。 邊緣:邊緣是分支機構、零售店或地理位置分散的辦公室,是過渡的位置。在某些情況下,虛擬化會將邊緣數據移回核心設施。與此同時,隨著嵌入式設備(攝像頭、POS終端、支付系統等)的激增,在邊緣地帶產生的數據比以往任何時候都要多。 端點:同樣,邊緣和端點之間的區別模糊,歐洲服務器,但到2025年,預計將有超過1500億臺物聯網設備,其中大多數將實時生成數據。移動設備是消費者生成和消費數據的首選設備(現在有81%的美國人擁有智能手機),但是這一類別還包括平板電腦、可穿戴設備、個人計算機和物聯網設備,這些設備可能不會存儲或處理但肯定會生成大量數據。
當企業響應端點作為其渠道的重要性時,安全性應強調(即招募/保留/開發)應用程序安全專業知識。端點開發是一個迫切的安全挑戰領域,因為開發周期短,而且無法采用平臺安全控制。隨著向更高服務和更快響應的發展推動本地分析,安全性應在邊緣進行積極的風險評估,域名購買,這需要更大的計算能力和更多的數據保留能力。
3. 第三方
簡單來說,云平臺就是別人的數據中心。在云中管理安全性意味著在第三方環境中管理風險并利用提供的控制。為了安全起見,云計算是第三方(風險)管理中的一項工作,信息安全將需要開發非常活躍的第三方管理技能集。
關于第三方,也要考慮組織的某些服務提供商所擁有的數據將具有或將具有分析價值。服務提供商將被要求:
提高自己的分析水平 提供更高級別的數據訪問 使數據可供客戶使用
在第三方分析的數據可能會增加價值,因此需要加強控制。當然,更大的訪問權限是身份和訪問管理的問題,而更高的可用性將意味著增加的數據流,需要重新評估連接控制。安全性應謹慎對待所有這些結果,并且通常應注意第三方數據保管者。
4. 復雜性
數據科學使用以字母V開頭的術語來描述大數據的特征。三個最重要的特征是數量(Volume)、多樣性(Variety)、速度(Velocity),它們共同描述了大數據的復雜性,以及它與先前數據管理概念的不同之處。