A 具有四大基本特征
金融業基本是全世界各個行業中最依賴于數據的,而且最容易實現數據的變現。全球最大的金融數據公司Bloomberg在1981年成立時“大數據”概念還沒有出現。Bloomberg的最初產品是投資市場系統(IMS),主要向各類投資者提供實時數據、財務分析等。
隨著信息時代降臨,1983年估值僅1億美元的Bloomberg以30%股份的代價換取美林3000萬美元投資,先后推出Bloomberg Terminal、News、Radio、TV等各類產品。1996年Bloomberg身價已達20億美元,并以2億美元從美林回購了10%的股份。2004年Bloomberg在紐約曼哈頓中心建成246米摩天高樓。到2008年次貸危機,新加坡云主機 香港云主機,美林面臨崩盤,其剩余20%的Bloomberg股份成為救命稻草。Bloomberg趁美林之危贖回所有股份,估值躍升至225億美元。2016年Bloomberg全球布局192個辦公室,擁有1.5萬名員工,年收入約100億美元,估值約1000億美元,超過同年市值為650億美元的華爾街標桿高盛。
大數據概念形成于2000年前后,最初被定義為海量數據的集合。2011年,美國麥肯錫公司在《大數據的下一個前沿:創新、競爭和生產力》報告中最早提出:大數據指大小超出典型數據庫軟件工具收集、存儲、管理和分析能力的數據集。
具體來說,大數據具有四大基本特征:
一是數據體量大,指代大型數據集,一般在10TB規模左右,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量。
二是數據類別大,數據來自多種數據源,數據種類和格式日漸豐富,已沖破了以前所限定的結構化數據范疇,囊括了半結構化和非結構化數據。現在的數據類型不僅是文本形式,更多的是圖片、視頻、音頻、地理位置信息等多類型的數據。
三是處理速度快,在數據量非常龐大的情況下,也能夠做到數據的實時處理。數據處理遵循“1秒定律”,可從各種類型的數據中快速獲得高價值的信息。
四是數據的真實性高,隨著社交數據、企業內容、交易與應用數據等新數據源的興起,傳統數據源的局限被打破,信息的真實性和安全性顯得極其重要。
而相比其他行業,金融數據邏輯關系緊密,安全性、穩定性和實時性要求更高,通常包含以下關鍵技術:數據分析,包括數據挖掘、機器學習、人工智能等,主要用于客戶信用、聚類、特征、營銷、產品關聯分析等;數據管理,包括關系型和非關系型數據、融合集成、數據抽取、數據清洗和轉換等;數據使用,包括分布式計算、內存計算、云計算、流處理、任務配置等;數據展示,包括可視化、歷史流及空間信息流展示等,主要應用于對金融產品健康度、產品發展趨勢、客戶價值變化、反洗錢反欺詐等監控和預警。
“互聯網+”之后,隨著世界正快速興起“大數據+”,金融行業悄然出現以下變化:
大數據特征從傳統數據的“3個V”增加到“5個V”。在數量(Volume)、速度(Velocity)、種類(Variety)基礎上,進一步完善了價值(Value)和真實性(Veracity),真實性包括數據的可信性、來源和信譽、有效性和可審計性等。
金融業按經營產品分類變為按運營模式分類。傳統金融業按經營產品劃分為銀行、證券、期貨、保險、基金五類,隨著大數據產業興起和混業經營的發展,現代金融業按運營模式劃分為存貸款類、投資類、保險類三大類別。
大數據市場從壟斷演變為充分市場競爭。全球大數據市場企業數量迅速增多,產品和服務的差異增大,技術門檻逐步降低,市場競爭日益激烈。行業解決方案、計算分析服務、存儲服務、數據庫服務和大數據應用成為市場份額排名最靠前的五大細分市場。
大數據形成新的經濟增長點。Wikibon數據顯示,2016年,全球大數據硬件、軟件和服務整體市場增長22%達到281億美元,預計到2027年,全球在大數據硬件、軟件和服務上的整體開支的復合年增長率為12%,將達到大約970億美元。
數據和IT技術替代“重復性”業務崗位。數據服務公司Eurekahedge通過追蹤23家對沖基金,發現5位對沖基金經理薪金總額為10億美元甚至更高。過去10年,靠數學模型分析金融市場的物理學家和數學家“寬客”一直是對沖基金的寵兒,其實大數據+人工智能更精于此道。高盛的紐約股票現金交易部門2000年有600名交易員而如今只剩兩人,其任務全由機器包辦,專家稱10年后高盛員工肯定比今天還要少。