产品简介

随着IT行业的不断发展,技术日新月异,包括现今最流行的云和大数据, 其最终目的都是为了提高信息的利用率、提高其流动性、进一步挖掘信息的价值, 因此数据本身的价值和重要性也越来越高。然而不管IT技术和行业如何发展, 其安全问题总是如影随形。近年来数据泄漏、销售非法数据获利等事件越发频繁。 虽然数据的泄漏并不一定会对企业造成直接的经济损失,但是间接损失和影响是巨大的, 或流失大批量的优质客户,或需要承担法律责任。

云图数据的测试数据管理与隐私数据漂白平台(以下简称“InfoMask”)是针对企业对隐私数据进行漂白脱敏, 对非生产环境的数据进行流程化管理的一套软硬件一体化的集成设备。InfoMask 整合了智能隐私数据发现、 数据抽取、隐私数据漂白、测试数据管理、数据装载、数据销毁、权限管理、性能监控等功能于一体, 能够提供优质的样例数据,以供各种非生产环境使用。通过技术手段遵循了法规要求,更好的保障了信息的安全。 以下是相关示意图:

云图数据的测试数据管理与隐私数据漂白平台
产品设计理念
     云图数据的测试与隐私数据产品方案的设计理念从使用者本身出发,在进行数据保护和提高项目质量的同时,保证其:
  • 项目实施成本低,即开即用;
  • 产品简单易用,对人员技能要求低;
  • 低维护成本,用户面对的是一个产品和服务商。
     让方案真正能解决问题而非增加问题。
功能介绍
     InfoMask产品部署时只需要通过以太网连接生产数据源和目标非生产数据源。InfoMask仅作为数据库的客户端访问数据库,不需要在InfoMask设备以外的环境安装部署任何组件。

数据发现

首先用户需要为应用系统确定隐私数据的定义,并以此为依据针对数据库梳理出一套完整的隐私数据的模型和关系。

发现功能会从生产数据源进行数据采样,然后对采样数据进行扫描,并根据InfoMask含有的隐私数据算法进行分析,定位哪些表哪些字段为隐私数据,属于哪种隐私数据。

数据抽取

然后通过InfoMask内部保存的生产数据的定义,从生产数据库或具有真实数据库快照等数据源当中周期性地抽取真实数据到InfoMask设备上。数据源种类支持各种主流的数据库系统。

数据漂白

根据定义好的隐私数据模型,将已经获取的真实数据使用特定的漂白规则进行脱敏,生成伪造数据。这样一套完整的伪造数据就存放在InfoMask设备上待用。由于设备是封闭系统,整个过程能够很好地防止数据泄漏。生成的伪数据具备以下特征:

  • 1.高度仿真;
  • 2.保持数据关联性
  • 3.隐私算法不可逆
  • 4.保持数据的唯一性

数据装载

需要测试数据的时候,用户使用受限权限的帐号登录InfoMask平台,InfoMask平台作为客户端连接到非生产环境的数据库,将已经漂白好的伪数据写入到目标数据库。

  • 1.支持生产系统和测试环境数据库异构
  • 2.支持元数据的装载
  • 3.支持全量和抽样装载
  • 4.支持数据子集装载
  • 5.默认使用高速的批量写入技术

系统监控

InfoMask能够对自身设备的各项资源进行实时监控和历史查询,包括CPU、内存等的繁忙程度,数据空间的使用率,还能对各种作业的运行状态进行监控。

数据管理

数据管理主要针对保存在InfoMask设备上的数据进行管理,包括元数据的定义、数据源的定义、隐私数据定义和数据关联关系定义等等。对于数据管理员来说,可以在这里看到隐私数据漂白前后的对比。

多用户与权限管理

InfoMask平台拥有完善的访问管理机制,其中包括了用户管理、各功能模块的使用和数据的访问权限。系统默认通过角色对用户的权限进行控制,缺省角色包括了系统管理员、数据管理员、操作员、开发者等。以此即可完成对各种用户角色的使用和访问控制。

用户行为审计

针对自身平台用户的操作与行为,可以进行记录与跟踪,其详细的行为信息能够以报表形式进行展现和检索。

审批流程管理

根据多用户的不同角色,从数据需求方的数据申请建立流程,到中间对应角色人员的审批,到执行人员的实际数据脱敏操作,以及最后的数据交付,InfoMask平台可以根据用户单位自身的责任分配情况建立对应不同的系统角色和数据申请审批流程,规范化测试数据的管理。

漂白模式选择

根据实际环境及可以使用要求,可硬灵活的选择数据漂白的数据试用方式。当漂白数据落地时,便于漂白数据管理及多数据源的按需装载等要求。当选用漂白数据不落地时,可以方便的应对海量数据处理。

异构数据迁移

在大多数测试场景及边缘系统数据库部署时,可以方便、灵活的实现异构数据下数据的迁移及漂白。在迁移中,不仅可以保证数据的完成性,同时也可最大程度的实现元数据的重构。

技术优势
  • 隐私数据发现 InfoMask内置十多种中国本土隐私数据类型的发现算法。自动对真实数据进行分析,然后找出隐私数据所在,极大地节省了人为梳理数据的工作量。
  • 隐私数据漂白算法 内置十多种中国本地隐私数据类型的漂白规则和算法可供直接使用。免去了二次开发和客户化的需求,大大降低了实施成本。
  • 深度压缩 数据存放在InfoMask设备中可以使用深度压缩功能,能够极大地提高数据存储能力。此功能对于用户使用来说完全透明,无需用户进行压缩和解压,且不影响数据的访问。
  • 异构数据库支持 生产数据库和目标测试数据库允许是异构数据库平台,InfoMask能够自动进行元数据定义的映射和编码转换,对用户来说也是完全透明,无需专门配置。提供了一个快捷的数据移植的通道。
  • 高速数据装载 InfoMask缺省使用了高速批量数据写入技术,比普通的插入命令快数倍,而且比数据专用的高速装载工具要简单,真正实现了简单快捷。
  • 简单易用 基于WEB的用户界面简洁明快,向导式的使用风格,内置了大量的规则、算法和默认配置,让用户能“傻瓜式”地操作即可完成任务。
  • 界面功能强大 界面集众多项目和客户需求进行综合设计,针对该类项目的各种需求都有相应的功能,让用户在各种情况下都能轻松应对。
  • 工作时间暂停 用户能够自定义休息和工作时间,让InfoMask在特定的休息时间内工作,在生产系统繁忙时暂停,这样就能做到对生产的影响完全可控。
  • 分布式架构 InfoMask底层采用大数据技术,经过重新设计,架构得到大幅精简,在单台设备容量或者性能达到瓶颈时,可以通过级联多台设备搭建分布式集群环境以达到扩展的目的。
兼容列表
支持的数据源种类
  • Oracle 9i, 10g, 11g, 12c
  • DB2 LUW v9.5, v9.7, v10.1, v10.5
  • DB2 for SYSTEM Z
  • DB2 for SYSTEM i
  • Informix Dynamic Server 11.5, 11.7, 12.1
  • SQL Server 2000, 2005, 2008, 2012
  • MySQL 5.x
  • MariaDB
  • Sybase ACE
  • PostgreSQL
  • Teradata
  • GreenPlum
  • IBM Netezza
  • Hadoop Hive
  • Hbase
  • H3C MPP Data Engine
  • 浪潮KDB
  • 达梦
  • 南大Gbase 8t/8a
  • 星瑞格SinoDB
  • 文本文件
  • MS OFFICE EXCEL
支持的浏览器版本
  • Microsoft Internet explorer 10以上
  • Google Chrome 25以上
  • Mozilla Firefox 15以上
  • Safari 4以上