如今的數據庫市場,用百花齊放來形容也絲毫不夸張。2020 年,Snowflake 上市,估值高達 700 億,是老牌數倉領導性企業 Teradata 的近 30 倍。
在 IaaS 層的建設完成后,企業愈發開始關注云對業務帶來的價值,因此,大量企業開始重構基于云架構搭建的互聯網基礎設施,而云數倉的構建與利用,正是大數據時代下企業數據管理能力的縮影。而這種趨勢在中國市場更甚,上云的旗鼓未熄,大量企業站在數字化轉型的檔口,龐大的數據體量及潛在分析需求,讓云原生數據庫成為兵家的必爭之地。
“彈性拓展”改造傳統數據倉庫困境
根據中國信通院數據顯示,2020年我國數據庫行業市場規模已經達到了240.9億元。隨著云計算的逐步普及,政企上云的需求日益顯現。按需分配、彈性擴容等云計算優勢,推動著企業對原有的 IT 基礎設施、架構及資源進行了重構。
例如,對金融、電信乃至許多互聯網行業企業來說,企業數據管理能力關乎生死存亡。海量的數據最終會匯集在數據庫管理系統當中,所有上層應用需要調取數據時也是從數據庫中查詢提取。
但相較于應用系統,數據庫管理系統處于更底層的基礎位置,同時,這個管理系統的效率及性能本身也決定了各應用系統能否運轉正常以及運行效率。在國產化浪潮的推動下,去 IOE 體系打破了企業及機構的原有 IT 定勢,也讓企業數據管理能力的升級及迭代提上了日程。因此,選擇一個合適高效的數據管理系統對于企業來說至關重要。
早期,市面上類似 Oracle、DB2 等數據庫企業,其主要適用領域還是傳統交易型場景,實質上它們對于節點及性能擴展、云支持能力都非常差,到 SQL on Hadoop 的大數據時代,以 HDFS 的分布式存儲讓節點的擴展與兼容性能逐步提升,但面向云的彈性擴容以及性能延展能力仍然較為薄弱。
在行業種種痛點亟待解決的環境下,偶數科技便應運而生。 2016 年,偶數科技成立,專注于分析型數據庫,并自主研發高性能云原生數倉產品 OushuDB、自動化機器學習平臺 LittleBoy、數據管理平臺 Lava,從底層能力出發,構建企業級核心數倉、數據集市、實時數倉以及湖倉一體數據平臺。
相比傳統的數據庫企業來說,偶數科技的云原生架構實現了存儲計算的分離,區別于集群內的每個節點存儲和計算都捆綁一起的MPP 架構,偶數科技的架構可以讓企業對數據的存儲和計算資源可以分開管理,從某種意義上來說實現了數據庫的“彈性擴展”。利用云原生架構與分析型數據庫(OLAP)相結合,偶數讓企業的數據管理規模以及上云能力達到了一個新的高度,突破了本地服務器的局限性,大幅提升了信息存儲和計算能力。
近期,偶數科技完成了 B+ 輪億元融資,這是繼紅點中國、紅杉中國、金山云之后,偶數科技完成的第四輪融資。
云原生打破數據孤島
云原生的概念是相對于傳統 IT 架構而言的。傳統數據庫打造的是一個個深井式集群,當一個集群無法承載現有數據時,就再增加一個集群,但放在數據井噴的現在,虛擬主機,這些深井之前互相變成了信息孤島,會爆發出不同集群間信息協同困難、跨集群查詢緩慢、數據大量冗余等各種各樣的問題。
并且,當積累的數據越來越多,directadmin漢化,節點達到系統架構的承載極限后,數據查詢以及處理的速度也會相應的越來越慢,陷入周而往復的惡性循環。例如同一個企業,不同的部門會存在重復存儲數據、數據不共享等問題,導致標準功能重復建設,設計標準參差不齊,浪費人力物力,嚴重的甚至會影響企業的經營,造成無效勞動、資源浪費等問題。云計算的時代,強調數據的共享與打通,基于云架構來構建的數倉,在相同的數據計算量下,可以通過快速拓展計算資源,節省 99% 以上的數據處理時間成本,大幅提升企業查詢效率,以實現降本增效。
早期的云原生數倉依托于云上無限擴容的基礎硬件設施,避免了運維人員在集群規模擴容時的空間困擾,以 Amazon Redshift、Azure SQL DW 為代表,用戶可以隨時調節集群中的計算節點數量,在云原生度上已經比 MPP 數倉、批處理數倉有了顯著改進。但這類數倉數據和計算沒有完成分離,當用戶對計算資源的需求增加時,需要同時購買計算和存儲資源,大大限制了數據資源的有效利用。