大数据技术当中,在海量数据的存储环节,涉及到两个重要的概念,就是分布式数据存储与数据库,稳定高效安全的数据存储,才能为后续的计算分析环节,提供稳固的支持。今天的大数据概念解析,我们来讲讲分布式存储与数据库。

进入大数据时代,数据特征发生了明显的变化,数据规模大、非结构化/半结构化的数据多,使得大数据存储本身也需要克服很多的问题。



要实现大规模数据的计算分析加工等问题,对于企业而言,需要通过各种手段来解决相关的问题,比如说通过优化存储基础设施,或者搭建高性能的大数据存储框架等等。

海量数据的存储任务,针对于不同的应用场景,往往需要因地制宜地选择存储方案,因此有了对象存储、块存储、文件系统存储等。
分布式文件/对象存储系统

分布式存储系统面向海量数据的存储访问与共享需求,提供基于多存储节点的高性能,高可靠和可伸缩性的数据存储和访问能力,实现分布式存储节点上多用户的访问共享。

目前业界比较流行的分布式存储系统包括:HDFS、OpenStack Swift、Ceph、GlusterFS、Lustre、AFS、OSS等。
分布式关系型数据库

关系型数据库是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。

目前业界比较流行的分布式关系型数据库包括:DRDS、TiDB、GreenPlum、Cobar、Aurora、Mycat等。



分析型数据库

分析数据库是面向分析应用的数据库,与传统的数据库不同,它可以对数据进行在线统计、数据在线分析、随即查询等发掘信息数据价值的工作。

目前业界比较流行的分析型数据库包括:Kylin、AnalyticDB、Druid、Clickhouse、Vertica、MonetDB、InfiniDB、LucidDB等。
图数据库

图数据库的基本含义是以“图”这种数据结构存储和查询数据,而不是存储图片的数据库。

目前业界比较流行的图数据库包括:Titan、Neo4J、ArangoDB、OrientDB、MapGraph、ALLEGROGRAPH等。



列存储数据库

列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。

目前业界比较流行的列存储数据库包括:Phoenix、Cassandra、Hbase、Kudu、Hypertable等。
文档数据库

文档型数据库是NoSQL中非常重要的一个分支,它主要用来存储、索引并管理面向文档的数据或者类似的半结构化数据。

目前业界比较流行的文档型数据库包括:MongoDb、CouchDB、OrientDB、MarkLogic等。
键值存储数据库

键值存储(Key-Value)是NoSQL中,数据模型中比较简单的一个了,主要就是用哈希表,通过对于键(Key)的查找来找到特定的数据。

目前业界比较流行的键值存储数据库包括:Redis、Memcached、Tair等。



关于大数据概念解析,分布式存储与数据库,以上就为大家做了一个简单的介绍了。大数据存储环节,涉及到分布式与数据库,是需要重点去掌握的一部分,对于主流的技术架构也需要有相应程度的掌握。
温馨提示:
1、在论坛里发表的文章仅代表作者本人的观点,与本网站立场无关。
2、论坛的所有内容都不保证其准确性,有效性,时间性。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
3、当政府机关依照法定程序要求披露信息时,论坛均得免责。
4、若因线路及非本站所能控制范围的故障导致暂停服务期间造成的一切不便与损失,论坛不负任何责任。
5、注册会员通过任何手段和方法针对论坛进行破坏,我们有权对其行为作出处理。并保留进一步追究其责任的权利。
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    • 售后服务
    • 关注我们
    • 社区新手

    QQ|手机版|小黑屋|数据通

    Powered by datatong.net X3.4  © 2008-2020 数据通