摘录
像 Duplicati 这样基于哈希的比较备份软件使用密码哈希来高效地识别和备份已更改的数据,以节省空间和时间。
介绍
数据备份在今天是至关重要的,以防止系统崩溃、网络攻击、人为错误和硬件故障导致的数据丢失。有不同的技术可用于执行备份,每种技术都有其优缺点。其中一种技术是基于哈希比对的备份软件。
本文概述了基于哈希比对的备份,其优势,流行软件的示例,选择时要考虑的因素,需要注意的限制,并提供选择正确备份软件的建议。
什么是基于哈希比对的备份软件?
基于哈希比对依赖于密码哈希函数来检测文件的更改。哈希值就像数据的指纹-文件的任何更改都会导致不同的哈希值。
备份软件生成并存储原始文件的哈希值。在后续备份中,文件再次进行哈希计算并进行比较。只有哈希不同的文件需要进行备份,因为相同的哈希值表示文件未更改。
这样可以避免再次备份未修改的数据,节省时间和存储空间。基于哈希的备份还可以可靠地验证文件完整性,当哈希不匹配时,修改的文件将被标记。
使用基于哈希比对的备份软件的好处
使用基于哈希比对的备份软件的一些主要优点:
高效的存储利用 - 在初始完全备份之后,仅备份文件的修改部分。这显著减少了存储空间需求。
更快的备份和恢复 - 哈希计算最小化了增量备份期间需要处理的数据量。恢复也更快。
变更检测 - 哈希不匹配可可靠地指示文件的任何更改,甚至到位级别。管理员可以轻松识别已更改或损坏的文件。
可审计性 - 基于哈希的方法提供了数据的完整性和可恢复性的验证。这满足了审计和合规性要求。
基于哈希比较的备份软件示例
许多备份解决方案提供基于哈希的增量备份:
Duplicati 使用哈希来识别更改的数据段,并对备份进行加密。
HashBackup 和 HashBackup for Linux 是专门用于基于哈希的去重的开源备份工具。
CloudBerry Backup 可以使用文件的哈希验证在云存储中执行增量备份。
Rsync 是一种流行的实用程序,用于生成文件的哈希签名,并仅通过网络传输更改的字节。
选择基于哈希备份软件时的考虑因素
在评估基于哈希的备份工具时,请考虑以下方面:
兼容性 - 支持您的操作系统、虚拟化程序、数据库、应用程序等。
可伸缩性 - 能够无缝处理大量和不断增长的数据。
可配置性 - 根据需求对备份范围、调度和保留策略进行细粒度控制。
安全性 - 备份的加密、访问控制和网络安全保护。
易用性 - 即使对非技术人员也具有简单的界面和工作流程。自动化能力。
成本 - 预付和持续的许可、存储和基础设施成本。
基于哈希比较备份的限制
虽然非常有用,但基于哈希的备份也有一些限制需要考虑:
文件大小影响 - 非常大的文件需要更长时间的哈希计算,降低备份速度。经常更改的大文件会影响增量备份效果。
未跟踪的文件 - 不在初始基线备份中的文件将不会被哈希和增量备份。
哈希冲突 - 密码哈希很少会发生冲突,可能导致错误的更改检测。
没有版本控制 - 删除或覆盖的文件无法恢复,因为只有最新版本被哈希和存储。
结论
基于哈希的增量备份可以实现高效的存储利用、更快的处理速度、可靠的变更跟踪和完整性验证。像 Duplicati 和 CloudBerry Backup 这样的软件提供了易于使用的解决方案。
然而,基于哈希的比较备份可能不适用于快速变化的非结构化数据。对于这种情况,可以考虑使用基于快照的备份等其他技术。在选择合适的软件时,组织应评估其特定的备份和恢复目标、数据概况和基础设施。