什么是数据脱敏?


数据脱敏

为了保护敏感数据,数据脱敏是一种修改数据存储中某些数据组件的技术,使结构保持相似,但信息发生改变。数据脱敏确保敏感客户数据无法在允许的生产环境之外访问。这在用户培训和软件测试等环境中尤其常见。

由于自动化开发和测试流程,直接接触敏感数据的可能性降低了。尽管如此,在各种场景中,数据仍然必不可少。假设一家银行将其部分开发工作外包给了海外公司。无论银行受哪个国家的管辖,客户信息通常都禁止离开银行。

外包的开发公司可以通过使用数据脱敏技术,使用类似于在实时生产环境中观察到的数据来测试软件。有效的脱敏需要数据更改,以避免重新设计或识别原始值。通过加密和解密,可以保留数据,可以证明安全策略,并且可以开始分离管理和安全功能。通过加密和解密,数据可以

数据脱敏类型

  • 静态数据脱敏 (SDM):数据首先在数据库中脱敏,然后复制到测试环境中,允许公司将测试数据迁移到不可信的环境或第三方供应商。

  • 动态数据脱敏 (DDM):DDM 消除了对额外数据存储的需求。数据在被请求之前保持未脱敏状态,此时它会被脱敏并传输。为了隐藏数据,内容会根据需要实时地进行混淆。未经授权的用户永远无法访问未脱敏的数据。要实现 DDM,您需要一个反向代理。动态数据脱敏的其他方法被称为动态数据脱敏。

数据脱敏的重要性是什么?

对于许多组织而言,数据脱敏是必要的,原因如下:

  • 数据脱敏解决了几个重大风险:数据丢失、数据泄露、内部威胁或账户泄露以及不安全的第三方系统接口。

  • 减少了云采用带来的数据安全问题。

  • 同时保留许多数据的内在功能特性,使其对攻击者不可用。

  • 授权用户(例如测试人员和开发人员)可以访问数据,而不会暴露生产数据。

  • 数据清理是可能的,因为传统的文件夹删除会在存储介质上留下数据痕迹,而清理会掩盖旧值。使用

数据脱敏技术

为了保护数据,您可以使用多种脱敏技术。以下是一些最流行的技术:

  • 替换是最常用的且成功的脱敏技术之一。使用此策略,真实数据将被虚假数据替换,这些虚假数据在使用时看起来像真实数据。电话号码、邮政编码、信用卡号码、社会安全号码和医疗保险号码以及其他数字通常使用此方法进行替换。替换名称时,可以从给定的或修改的搜索文件中随机替换真实姓名。

  • 另一种突出的脱敏方法是混淆。它与上面描述的替换方法非常相似,只是替换集是从与脱敏数据相同的列中派生的。也就是说,数据在列中随机打乱。

  • 加密是最具挑战性的数据模糊化技术之一。要根据用户权限和特权读取数据,特定的加密技术需要使用“密钥”。

  • 可以使值无效或删除。对字段应用空值似乎是一种简单但实用的方法来掩盖数据。另一方面,此方法仅对防止直接数据可见性有用。但是,在大多数情况下,这种脱敏方法会使大多数程序的逻辑失效;因此,它不像看起来那么好或有效。

  • 数字和日期的变化。如果正确执行,数字和日期的变化可以为您提供相关统计信息,而不会泄露敏感的财务信息或交易细节。假设您需要隐藏员工的薪资。

  • 在脱敏时,您可以对所有薪资应用相同的变化,以确保最高和最低薪资员工之间的薪资范围保持准确。

  • 字符随机排列。这是一种简单的方法,其中字符以随机顺序排列以模糊原始信息。

数据脱敏的优势是什么?

安全性的基本目标是确保数据机密性,以便能够确信他们的信息是安全的。正确执行的脱敏可以在保留数据内容的同时保持业务价值。有多种指标可以衡量脱敏程度,最常见的是 K-匿名性因子,但所有这些都应该进行左移测试以验证数据安全性和合规性。

与可能通过设计方法获取用户凭据而被规避的加密不同,脱敏以不可逆的方式保护下游环境中的数据。

无需编程专业知识,即可在异构数据源中保持引用完整性的同时进行一致的数据脱敏,从而在敏感数据可用于开发和测试或发送到异地数据中心或公有云之前保持其安全性。

更新于: 2022年3月15日

693 次查看

开启您的 职业生涯

通过完成课程获得认证

开始学习
广告