在介紹資料庫行業發展現狀之前,先來了解一下資料庫行業概況,資料庫的誕生和發展給計算機信息管理帶來了一場巨大的革命。三十多年來,國內外已經開發建設了成千上萬個資料庫,它已成為企業、部門乃至個人日常工作、生產和生活的基礎設施。同時,隨著應用的擴展與深入,資料庫的數量和規模越來越大,資料庫的研究領域也已經大大地拓廣和深化了。下文是對2015年資料庫行業發展現狀分析。
通過對資料庫行業現狀分析獲悉,資料庫系統的萌芽出現於60年代。當時計算機開始廣泛地應用於數據管理,對數據的共享提出了越來越高的要求。傳統的文件系統已經不能滿足人們的需要。能夠統一管理和共享數據的資料庫管理系統(DBMS)應運而生。
1. 新型資料庫的不斷壯大
眾所周知,關係型資料庫已經出現了近40年,並且在很長一段時間裡一直是資料庫領域當之無愧的王者。如今,新型資料庫,包括NoSQL以及NewSQL兩種主要類型,這位後起之秀正在進入越來越多的應用領域。更多最新資料庫行業現狀分析信息請查閱中國報告大廳發布的《2015-2020年中國資料庫行業市場發展現狀及投資前景預測報告》。
新型資料庫廠商的參加也是本屆SHW大會亮點之一,其中有NoSQL界的佼佼者,如Couchbase、Aerospike、Marklogic和 SequoiaDB等,也有NewSQL的許多廠商,如:MemSQL、VoltDB、ScaleDB和CitusDB等等。這些企業在現場和 Cloudera、Hortonworks這些大數據領頭羊一樣,得到了廣泛的關注。
隨著「大數據時代」的到來,在高並發、大數據量、分布式以及實時性的要求之下,傳統的關係型資料庫,因為其數據模型以及預定義的操作模式,在很多情況下不能很好的滿足以上的需求,所以新型資料庫如今在大數據的場景下,取代了傳統關係型資料庫成為主導。相信未來隨著大數據的發展,新型資料庫將會顛覆資料庫領域。
正如MemSQL的CTO Eric Frenkiel在主題演講中說道:「We need a new kind of database to do things we have never done before!」
2. SQL與Hadoop的集成遇到了挑戰
值得注意的是,除了NoSQL等新型資料庫技術以外,傳統的資料庫廠商也在尋求能讓關係型資料庫完美對接Hadoop等大數據架構的方法,但是仍然沒有找到能很好解決的方法。
展會上,IBM的工程師們分享了他們在SQL與Hadoop的結合上進行的嘗試。其中提到,SQL和Hadoop的對接主要的難點之一是SQL語句如何在 Hadoop上執行,因為Hadoop的文件系統HDFS的設計並不能有效的運行SQL。IBM則正在探究如何更好的解決這一個SQL和Hadoop對接的核心問題。大會上IBM分享的就是基於IBM的BigInsight的BigSQL實現的SQL與Hadoop對接。
同樣作為傳統RDBMS領頭羊的Oracle也在大會上發布了最新版的Oracle BigDataSQL以及Oracle NoSQL等等大數據產品。
這些RDBMS先驅們的這些舉動也從側面說明了,新型的資料庫的出現不僅很有必要,而且完全有能力替代很大一部分關係型資料庫的應用場景。
3. 大數據架構加強對NoSQL的支持
NoSQL在資料庫領域的影響力日漸壯大,領頭羊MongoDB,Cassandra和Redis已經在DB-Engine的資料庫排名上進入了前十。所以許多的大數據架構、平台也都在越來越強化對於NoSQL資料庫的支持。
Cloudera 的CTO, Amr Awadallah 在他的演講中介紹了未來Hadoop的發展規劃,其中很重要的一點就是加強對NoSQL資料庫的支持:「We will improve the integration with NoSQL database to make Hadoop more versatile.」
無獨有偶,在另外一場主題演講中,Databricks的CTO Matei Zaharia,也介紹了Spark 在2015年的新的發展方向,包括新增機器學習的流水線功能,R語言的集成,當然也包括了更好的支持NoSQL資料庫。
可以看到,NoSQL資料庫在大數據生態系統中的作用和地位正在不斷的提升,相信在大數據漸漸普及的將來,NoSQL甚至有希望取代關係型成為資料庫的先鋒。
總結:
資料庫作為底層的數據存儲和管理工具,是大數據生態系統中不可或缺的一環。傳統的關係型資料庫已經存在了幾十年,雖然有其適合的場景,但是對於大數據的應用下,存在較多的局限性。新型的資料庫是本屆SHW大會的焦點話題之一。高性能、高可用、靈活的數據結構等等主要特性,都讓他成為大數據存儲分析的不二之選。所以我也希望大家能更多的關注新型資料庫的發展。