Bit Rot 存储位衰减 无形的数据损失

来源:ZDNet存储频道 原文:http://stor-age.zdnet.com.cn/stor-age/2007/1217/684190.shtml 时间:2007-12-17 作者:存储时代/盛瓦(编译)

虽然人们越来越注重数据保护和数据备份,但是如果不提出有效的解决方案的话,无形中的数据丢失——或者称为“Bit rot(是指物理存储介质的衰减)”所带来的隐患将凸显出来。

最近,全球最大的粒子物理研究实验室——CERN欧洲核子研究中心发表了一份关于数据损坏(Data Corruption)和存储介质衰减的报告。在报告中,CERN研究员Peter Keleman列出了存储专家值得关注的几个解决方案。

那么这与我们终端用户有什么关系呢?我突然想起几个月前碰到的一个关于数据损坏的问题。

今年8月,我访问了一家不知名的旅行公司的网站并且预订了一些行程的机票。几个小时之后,我再登录这个网站市发现密码无法通过验证了。我猜想这个公司的网站的服务器可能当机了,于是在午饭过后再一次登陆,但遇到了同样的问题。我拨打了这家公司的预订机票的电话,那头的工作人员告诉我他们没有发现任何问题,然后我又拨打了用户支持热线,他们告诉我可以把我的密码用电子邮件发送过来。

我收到密码后非常失望,因为我原来设定的密码结尾是()!@,而发过来的密码结尾却变成了(]!@。我开始担心有人盗取了我的密码,然后更改密码使用我的信用卡(更糟糕的是,使用卡上的钱)。我再次打电话询问那家旅行公司的工作人员我的密码最后一次修改是在什么时候,被告知是在一年之前时我终于舒了一口气。

关于字符的问题

我决定对这件事进行深入的研究调查,当然部分原因是出于职业好奇。我觉得这件事可能与字符设置有关系。我猜想这家公司使用的不是IBM大型主机,而且系统使用的是ASCII码(American Standard Code for Information Interchange,美国信息交换标准码),而不是EBCDIC(Extended Binary Coded Decimal Interchange Code,扩增二进式十进交换码)。我首先列出了一个ASCII码换算表,从这个表中你就能看出“)”和“]”这两个字符从ASCII码转换成数据有什么不同。

二进制

八进制

十进制

16进制

字符
010 1001 051 41 29 )
101 1101 135 93 5D ]

据我所知,CERN使用的磁盘驱动器大多是SATA盘,难道这就是造成我密码丢失的主要原因吗?当然,我的七位密码中至少有四位已经丢失了。

从这点来看,我觉得需要找到这家公司的某人向我提供第三方支持。虽然已经是下午了,但是我不费力就找到了第一个人和我谈论有关ASCII码和字位丢失的问题,几分钟之后我又找到了能够理解我所说的但却认为我是头脑发热的人,但最终我还是找到了可以提供第三方支持的那个人。我解释说,我是一名存储咨询师,在遇到这个问题时就仔细地考虑所有因素。有趣的是,谈话的过程中他接到了另一位和我遇到同样问题的计算机咨询师打来的电话,只不过他的密码被改成了其它字符。两个人在同一天遇到同样的问题。

我向这第三个人建议说,他们应该好好检查一下于用户密码设置有关的磁盘和硬盘驱动器,我问他们所使用的驱动器类型是SATA还是光纤通道(FC),最后问他是否介意给我发一封电子邮件告诉最后结果。他爽快地答应了我的请求,当然此后就一直杳无音信。我很想得知这个问题的真正原因,但是我也可以理解他们不愿意对外宣布这样的信息。

技术局限

看来密码丢失的真正原因我是永远也不得而知了,但是为什么别人的密码也丢失了,或者说这个问题为什么这么普遍地存在呢?我认为目前人们对数据路径的保护有限,所以不断有数据发生丢失的情况。

T10工作组出台了一项名为“数据完整性域”(Data Integrity Field,DIF)的新标准,可以由SCSI驱动程序传递一个校验和(checksum)字节到磁盘上(潜在的应用)。这项标准以及Sun的ZFS文件系统都是防止数据丢失的新尝试,但是目前人们对这种数据损失认识尚浅,想要彻底解决这个问题只是徒劳无获。当你遇到类似的问题时很难在短时间之内找到解决方法,于是你开始更换部件这样就更难找出问题的真正根源了。

我认为数据损失无时无刻不在发生,而且以目前的技术水平来看我们还找不到解决这个问题的有效方法。无所不在的数据网络引发了海量数据的爆发,我们需要对数据路径进行纠错编码(Error Encoding)来保证数据不会丢失在无边的网络中。但问题是,纠错编码会降低性能、增加成本,我会为提高了的可靠性而支付额外费用,那你呢?

评论

《“Bit Rot 存储位衰减 无形的数据损失”》 有 1 条评论

  1. […] Live Digital 跳至正文 首页关于 ← 从32口到2口:ZFS和Linux MD RAID理想的SATA/SAS控制器列表 Bit Rot 存储位衰减!无形中的数据损失,何时突破技术局限? → […]

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据