大数据时代,不懂点存储技术知识哪里好意思!

日期:2020-01-21 / 人气: / 来源:未知

一、预备知识

为了避免专有名词缩略语干扰我们,先解释一下。

  • SCSI接口
  • 小型计算机系统接口(Small Computer System Interface; 简写:SCSI),就是计算机主机内部设备之间(硬盘、软驱、光驱、打印机、扫描仪等)系统级接口的独立处理器标准。
  • iSCSI接口
  • Internet小型计算机系统接口,又称为IP-SAN。iSCSI 常常被认为是光纤通道(Fiber Channel)的一个低成本替代方法。iSCSI 就是用广域网仿真了一个常用的高性能本地存储总线,从而创建了一个存储局域网。
  • ETHERNET(以太网)
  • 目前我们家里,或者公司办公用的局域网基本上都是基于以太网交换机组建的,它基于IP协议。
  • FC(光纤通道,Fiber Channel)
  • 这种网络和以太网的区别就是:它用的是价格昂贵的光纤交换机,连接接口使用SCSI而不是IP协议。

二、目前主流的储技术

1、DAS(直接连接存储:Direct Attached Storage)

大数据时代,不懂点存储技术知识哪里好意思!

 

直接连接存储是指将存储设备通过SCSI接口直接连接到一台服务器上使用。存储介质直接挂接在内部总线上,数据存储是整个服务器结构的一部分。

DAS的优点

  • 安装简单,存储设备便宜。

DAS的缺点

  • 不具备灾备能力,仅适合小规模(家用,小企业使用)。
  • 不适合对性能要求高的场景。

2、NAS(网络附加存储服务器:Network Attached Storage)

NAS设备本质就是将本地主机的文件系统迁移到IP网络的设备上,多个节点可以共用一个NAS上的同一个文件系统。

大数据时代,不懂点存储技术知识哪里好意思!

 

NAS其实是一个网络上的瘦服务器,对用户提供文件系统访问的能力,管理存储介质和负责数据备份。平常我们在x86的服务器上开启samba服务,然后在windows上映射一个盘符到samba服务器上就可以像使用本地存储一样使用服务器上的存储,这时,这台服务器也可以看做是一台NAS服务器。

大数据时代,不懂点存储技术知识哪里好意思!

群辉NAS图

FTP服务器算不算NAS?

不算, 因为客户访问FTP服务器上的文件,还需要先将完整文件下载到本地的文件系统目录里面。而NAS上的网络文件系统是可以不依赖本地文件系统,直接挂载使用的(例如目前常用的NFS, CIFS文件系统)。

3、SAN(存储区域网络:Storage Area Network)

SAN是通过专用高速网将一个或多个网络存储设备和服务器连接起来的专用存储系统。可以把SAN理解成一个网络,这个网络里包含着各种各样的元素,比如磁盘阵列,FC交换机。

大数据时代,不懂点存储技术知识哪里好意思!

 

FC_SAN拓扑结构图

SAN的类型划分

SAN可以分为FC_SAN何IP_SAN两种类型。

  • FC_SAN

SAN原本只有FC-SAN一种,一般说的SAN就是指FC_SAN。它使用光纤通道传输数据,其采用的是SCSI协议。

  • IP_SAN

IP_SAN是FC_SAN后产生的它采用通过IP网络传输数据,采用iSCSI传输标准传输SCSI协议数据。

FC_SAN与IP_SAN的对比

FC_SAN优势:

  • 传输带宽高,目前有1,2,4和8Gb/s四种标准,主流的是4和8Gb/s
  • 性能稳定可靠,技术成熟,是关键应用领域和大规模存储网络的不二选择。

FC_SAN缺点:

  • 成本极其高昂,需要光纤交换机和大量的光纤布线;
  • 维护及配置复杂,需要培训完全不同于LAN管理员的专业FC网络管理员。

IP_SAN优势:

  • 成本低廉,购买的网线和交换机都是用以太网,甚至可以利用现有网络组建SAN;
  • 部署简单,管理难度低;
  • 万兆以太网的出现使得IP SAN在与FC SAN竞争时不再逊色于传输带宽;
  • 基于IP网络的天生优势使得IP SAN很容易实现异地存储、远程容灾等穿越WAN才能时间的技术。

IP_SAN缺点:

  • IP_SAN在性能各方面FC_SAN还是有差别的。专有领域还是FC_SAN的天下。
大数据时代,不懂点存储技术知识哪里好意思!

 

三、从结构上看DAS、SAN与NAS的区别

DAS很容易区别出来,但SAN和NAS两者还是有点难区别。仅仅通过是否使用FC来区别SAN和NAS其实已经不合适了,因为IP_SAN就不是采用FC的SAN。可以通过文件系统和存储的位置来加以区别。请看下图三者的对比:

大数据时代,不懂点存储技术知识哪里好意思!

 

解读:

  • DAS里,操作系统,文件系统,存储是一个整体。
  • NAS里,把文件系统和存储给分离出去了。
  • 在SAN里, 仅仅把存储给独立出去,文件系统依然在访问端。

于是,根据文件系统所在的位置,可立可以识别NAS和SAN:

NAS的文件系统在NAS设备这边,而SAN的文件系统还是在访问端的操作系统里。

四、NAS与SAN的对比与关联

NAS与SAN的对比

  • 性能:
  • a. SAN几乎接近主机内部内存的访问效率,而NAS要经过以太网,一般来说要慢很多,特别是对大块的数据的读取。但是当速度的瓶颈在磁盘等存储介质上时,光纤网络的优势不再时,NAS由于经过优化的文件系统(并发、分布式)会展示出比SAN更加优越的性能!

 

  • NAS相对SAN的优势:
  • a. NAS的成本比SAN低很多
  • b.NAS由于利用了以太网,部署方便的多
  • c.NAS设备一般都提供多种协议访问数据(POSIX, SAMBA),而SAN只能使用SCSI协议访问经过特别优化的NAS系统, 可以同时并发处理大量客户端的请求,提供比SAN方式更方便的访问方法。

NAS与SAN的关联

根据上面提到的NAS与SAN的区别,我们可以知道,SAN是对用户提供的是高速以块为单位的存储接口,而NAS为用户提供的是以文件为单位的存储接口。

可以说SAN可以看成是网络上的硬盘,SAN可以看成是网络上的文件系统。NAS拥有网络文件系统的优势,而SAN有底层高速数据块的存储优势,所以可以把两者结合起来使用,所以有了NAS-SAN这样的东西。例如下图:

大数据时代,不懂点存储技术知识哪里好意思!

 

上图例子中,用户通过网络访问NAS的文件系统,而NAS的文件系统具体的数据由FC_SAN来提供。

五、分布式存储和NAS、SAN

分布式存储属于另外的存储形式,其依赖于网络上多个存储节点。对于NAS和SAN来说,可以说都是集中存储,分布式存储是分布式的。

NAS,SAN靠磁盘阵列来保证可靠性,而分布式存储系统本身有多个网络节点,通过多节点上的数据冗余来保证可靠性。分布式存储目前已经热火朝天,相信都有所了解,相比集中式存储,有一大堆好处,但是具体就在此不做讨论。

作者:admin