返回IT运维网
  • |
  • 文章EID:
  • |
  • 账号:
  • 密码:
宏杉存储平台ODSP全新升级 存储更安全高效
2018-06-15 IT运维网 / IT运维网

      宏杉科技,作为一家专业的存储系统及解决方案供应商,产品早已覆盖数据管理各个领域。在这其中,开放数据存储平台(Open Data Storage Platform,简称ODSP)是宏杉科技自主研发的软件平台,应用于宏杉科技所有的存储产品。统一的软件平台,一方面保证了各档次存储功能的一致性,另一方面,让用户可以在因数据量增大而更换存储时,完全实现平滑无缝升级,大大减少了数据迁移的成本。

      最近,ODSP进行了全新升级,带来了大量的新特性。其中安全、效率方面的诸多特性让人眼前一亮,给用户带来了更好的数据体验。今天,我们就来看一看ODSP升级后的特性。

IDDC2.0 用AI排查隐患盘

      IDDC全称是Initiative Disk Diagnosis Center,主动式磁盘诊断中心。不久前,宏杉科技发布IDDC2.0技术,实现了磁盘预检测中心、磁盘诊断中心、智能磁盘预警中心这三大功能。其中,智能磁盘预警中心是最大的看点。宏杉科技把AI技术引入到其中,通过筛查指纹、复位指纹、慢盘指纹、寿命指纹对隐患盘进行预警排查,把隐患硬盘消灭在萌芽中。

      众所周知,硬盘是IT系统中最容易出现故障的器件。包括RAID在内的硬盘保护机制大多是后处理型,也就是硬盘发生故障后进行恢复。有没有方法提前找出存储设备中哪些磁盘存在隐患?宏杉科技对历年来累积的用户局点磁盘错误信息和现象、返厂故障盘分析等大量的工程数据做了专项分析,找到了其中一些规律,并基于这些规律研发了智能磁盘预警中心。根据分析大量工程数据找到的规律,智能磁盘预警中心定义了特征指纹,对于匹配到特征指纹的磁盘,采取不同的处理方案,进行“修复”或者“预警”。其中,关键指纹如下:

筛查指纹:集成磁盘厂家的原厂检测工具,采用先进武器精准筛查故障盘。

复位指纹:根据数据流上实时错误,立即修复磁盘。

慢盘指纹:一旦发现慢盘,立即处理。

寿命指纹:根据磁盘使用情况,预测寿命。

      将AI技术进入到隐患盘的排查,使得提前预测硬盘故障成为一种可能。当前IDDC 的智能磁盘预警中心只是牛刀小试。随着不断的实践深入,一定会给我们带来更大的惊喜。

复制、镜像、双活、快照、克隆 更全面地应对软灾难和硬灾难

      数据保护和灾备是存储系统的重要功能。在已有的复制、镜像、双活、快照、快照视图特性的基础上,ODSP2.0又新增了克隆、本地镜像、本地复制等功能,使得功能更加完善。看着这些生硬又相近的名字,是不是感觉有点晕?看看下面这种图,大概就清楚了。

      “软灾难”,故名思议,指“软”的灾难,通常指由于误操作、软件Bug、病毒等导致生产数据逻辑上损坏或者不能读取。比如:近期让人崩溃的勒索病毒就属于“软灾难”。“硬灾难”,则是指“硬”的灾难,通常指硬盘故障导致RAID故障、设备故障(包括硬件故障、台风、暴雨、地震、火灾等不可抗因素)等情况下,生产数据卷中数据物理上被破坏。

      快照和快照视图功能是传统数据保护特性之一,也是应对“软灾难”的神器。通过快照和快照视图功能,可以为每份数据提供2048个历史时间点记录,确保有可恢复的时间点数据。当然,从节省空间维度考虑,快照技术是增量的,不是全量的。而克隆技术则为数据提供了一份全量的数据保护。也就是由生产卷和克隆卷构成一个克隆对,克隆卷是生产卷某个时刻的映像。传统克隆技术是单向的,只能从生产卷->克隆卷进行数据同步。宏杉科技的克隆技术却是双向的,支持生产卷->克隆卷、克隆卷->生产卷两种同步模式。换言之,生产卷、克隆卷两者同等重要,需要哪个就从哪个恢复。

      在应对硬灾难方面,复制、镜像、双活是常用的数据保护技术,基于功能都是在主备数据卷之间进行数据同步。三者的差异在于:

复制:主备卷数据传输是异步进行,数据有一定的差异量。

镜像:主备卷数据传输是同步进行,数据完全一致。但不能自动切换。

双活:主备卷数据传输是同步进行,数据完全一致,且能自动切换。

      在此基础上,针对灾难发生位置的不同,宏杉科技提供了两个系列的方案。如果硬灾难发生在一套设备内部,比如RAID失效等,通过本地复制、本地镜像、克隆来应对。如果整套设备甚至数据中心站点发生灾难,可通过复制、镜像、双活来应对。

      更重要的是,这些灾难应对技术不是孤立的,而是可以组合使用的。比如采用双活+复制+快照,可实现“二地三中心”的灾难应对方案。基于ODSP的这些丰富的数据保护和灾备特性,可全面应对各种软硬灾难。

巡检机器人和告警定制 给运维方式来一个“私人定制”

      用户IT运维人员面临的最大挑战是7*24小时不停机,业务必须保证连续性等常见需求,运维人员不得不时刻紧绷神经惦记着IT系统运行是否正常。

      巡检是常用的运维方式,通过巡检可提前排查并处理IT系统中是否存在隐患,以避免IT异常带来不可控的影响。宏杉的巡检机器人可以自动化执行,自动巡检,替代运维人工操作。升级后的ODSP平台能够更好的兼容巡检机器人,可巡检的范围更广,可巡检的科目更多了。

      系统运维的另外一个重要方式就是告警,当IT系统运行过程中出现异常时,通过告警可以让运维人员在第一时间接收到异常信息,以便尽快进行处理,控制异常影响范围。面对不同的告警需求,宏杉升级了ODSP软件架构中告警模块。

      ODSP针对存储设备中所有模块,包括SPU、DSU、电源模块、风扇模块、电池模块、磁盘模块、RAID、LUN、快照、复制等,分别定义了完备的告警事件。告警事件多达数百个。告警方式有指示灯告警、蜂鸣器告警、管理界面告警、邮件告警、SNMP Trap告警、短信告警等6种。

      如果所有的告警都通过所有的方式通报出去,那么告警管理将会是灾难性的。在ODSP升级后,告警方式可以按需定制了。针对每一个告警事件,运维人员可按实际需求设置对应的告警级别,并设置是否触发各项告警功能的开关。这样就使得管理员在选定的时刻可以及时了解到自己所关心和所需要的告警信息,而不会被其他告警信息所影响。这样的告警方式,完全就是一个运维的“私人订制”。

      ODSP全新升级,给存储系统带来了更多的安全、效率保障。正如本文开头所说,宏杉科技作为一家专业的存储系统及解决方案供应商,在保障存储系统安全性、提高系统效率的道路上永不停歇!

      最后,还得报告一下,ODSP升级之后,操作界面已经升级为B/S,而且看着还挺简洁顺眼的。入门级技术水平,基本看懂并上手操作,工程师大牛们用起来应该更是得心应手了。欢迎新老用户升级体验。

相关评论 [查看所有评论]
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
心情:
  • 支持
  • 高兴
  • 枪稿
  • 不解
  • 搞笑
  • 愤怒
  • 谎言
账号: 密码:
验证码 看不清?点击更换
相关阅读