在進入大數(shù)據(jù)時代的今天,數(shù)據(jù)對企業(yè)而言具有了越來越豐富的內涵:一方面,越來越多的企業(yè)依靠對數(shù)據(jù)的不斷探索和深入挖掘贏得了競爭優(yōu)勢;另一方面,一些新的商業(yè)模式依靠對數(shù)據(jù)的深入挖掘而誕生,數(shù)據(jù)已經(jīng)成為企業(yè)是一種新的“能源”,并成為企業(yè)正在進行的數(shù)字化轉型的基石和助推劑。很顯然,企業(yè)對數(shù)據(jù)價值的追求已經(jīng)成為了數(shù)字經(jīng)濟發(fā)展的一股強大動力。與此同時,隨著企業(yè)對數(shù)據(jù)利用不斷走向深入,對相關的技術和解決方案也提出很高的要求。
全生命周期的數(shù)據(jù)服務
數(shù)據(jù)從其產(chǎn)生到采集、傳輸、存儲到分析和展現(xiàn)涉及到很多技術和多個環(huán)節(jié),任何一個環(huán)節(jié)處理不好都會影響數(shù)據(jù)價值的最終體現(xiàn)。
比如,在數(shù)據(jù)的采集上不僅會有實時數(shù)據(jù)的采集也會有批量的數(shù)據(jù)采集;不僅有結構化數(shù)據(jù)的采集還有非結構化數(shù)據(jù)的采集。而且,對于大多數(shù)企業(yè)而言其數(shù)據(jù)的來源往往都是多源的,比如銷售可能是多渠道的,有線上和也有線下,線上又有社交渠道還有傳統(tǒng)電商;數(shù)據(jù)不僅來自企業(yè)內部也可能來自外網(wǎng)(如社交媒體)等,這就要求解決方案能支持各種數(shù)據(jù)源、各種數(shù)據(jù)類型。
數(shù)據(jù)采集后在進入數(shù)據(jù)庫、數(shù)據(jù)倉庫或者數(shù)據(jù)湖進行存儲之前,需要進行數(shù)據(jù)的清洗和整合,以確保后期數(shù)據(jù)分析的準確性。因為由于設備和傳輸以及人為方面的原因,數(shù)據(jù)采集過程中可能會有錯誤數(shù)據(jù)混入。
在存儲環(huán)節(jié),不僅在存儲空間上要滿足未來可能的擴展需求,還需要支持各種業(yè)務使用需求,包括實時查詢和批量處理。由于數(shù)據(jù)的用途不同,會使用到不同的存儲技術,比如有的用傳統(tǒng)關系型數(shù)據(jù)庫,有的則用Hadoop等NoSQL數(shù)據(jù)庫。
而在數(shù)據(jù)分析和展現(xiàn)上,需要數(shù)據(jù)建模和各種數(shù)據(jù)挖掘工具,企業(yè)需要借助這些工具,最后才能形成各種分析結果,如用戶畫像、營銷策略分析、風險和故障預警等,為企業(yè)業(yè)務運營提供支持。
另外,這幾年技術進步的腳本明顯加快。以基礎架構為例,英特爾一直在持續(xù)更新至強® 可擴展平臺,亞洲服務器租用,處理器不僅在性能上不斷提升,讓用戶很方便地獲得性能強勁、簡單易用的云化基礎設施,同時,還通過融合自動化和智能化管理特性,確保云的彈性擴展、穩(wěn)定可靠和降本增效。尤為值得一提的是,至強可擴展處理器還特別為數(shù)據(jù)的分析和處理進行了優(yōu)化。另外,在存儲、網(wǎng)絡等相關產(chǎn)品上也在持續(xù)升級,特別是英特爾傲騰™持久內存的推出,可以大幅提升應用程序效率,顯著改善用戶體驗。是否能緊跟技術發(fā)展的腳步,充分享受技術紅利也非常考慮廠商的技術實力。
正是由于涉及太多技術,因此對廠商的解決方案能力提出了很高要求,不僅有廣度還有深度,因此,很長時間以來,市場上能提供全功能的數(shù)據(jù)服務解決方案的企業(yè)并不多。中科曙光是其中之一。實際上,由于中科曙光軟硬一體化的能力、多年來在數(shù)據(jù)領域的技術積累以及方案的完整性,中科曙光的數(shù)據(jù)工程服務解決方案得到了市場的廣泛認可和使用。
中科曙光數(shù)據(jù)工程服務解決方案主要圍繞用戶數(shù)據(jù)提供專業(yè)全流程數(shù)據(jù)服務,幫助用戶完成數(shù)據(jù)采集、數(shù)據(jù)規(guī)范、數(shù)據(jù)智能分析,生成數(shù)據(jù)資源目錄、構建知識圖譜,設計可視化主題,支撐業(yè)務應用,發(fā)揮數(shù)據(jù)價值,展示數(shù)據(jù)魅力。
數(shù)據(jù)源: 能夠適配用戶各類結構化、半結構化、非結構化以及第三方系統(tǒng)等各類異構數(shù)據(jù)源,根據(jù)應用需求定制實現(xiàn)數(shù)據(jù)匯聚采集。
數(shù)據(jù)綜合治理:針對用戶數(shù)據(jù)特性及行業(yè)數(shù)據(jù)應用要求,提供專業(yè)的數(shù)據(jù)采集和治理服務;智能感知數(shù)據(jù)類型,實現(xiàn)對多源異構數(shù)據(jù)的自動采集,統(tǒng)一規(guī)范,提升數(shù)據(jù)質量;為數(shù)據(jù)智能應用夯實基礎。
數(shù)據(jù)智能分析: 基于曙光大數(shù)據(jù)先進技術和應用經(jīng)驗,針對用戶智能分析應用要求提供數(shù)據(jù)智能工程服務,幫助用戶構建各類專題數(shù)據(jù)集、生成數(shù)據(jù)資源目錄、打造行業(yè)知識圖譜、訓練專業(yè)機器學習及人工智能模型;為用戶業(yè)務應用提供數(shù)據(jù)價值支撐。
數(shù)據(jù)共享交換: 根據(jù)用戶數(shù)據(jù)使用特性及安全要求,構建共享轉換服務,實現(xiàn)共享前天下保障數(shù)據(jù)安全,真正幫助用戶發(fā)揮數(shù)據(jù)價值。