天天看点

星环科技Defensor 4.0:大模型驱动的数据安全管理平台

作者:星环科技

5月26日向星力•未来数据技术峰会上,星环科技数据安全管理平台 Defensor 发布 4.0 版本,新版本引入大模型,可实现智能化自动化分类分级,帮助企业盘点敏感资产。同时,Defensor 联合星环科技数据 API 安全网关 Midgard、数据库监测与审计软件Audit 等数据安全产品可帮助企业构建事前可知可防、事中可控、事后可查的全链路数据安全防护体系。

星环科技Defensor 4.0:大模型驱动的数据安全管理平台

事前可知,基于大模型的智能化分类分级

星环科技Defensor 4.0:大模型驱动的数据安全管理平台

事前阶段,Defensor 可以帮助企业梳理敏感资产,形成敏感资产清单,同时明确敏感资产分布情况,并对敏感资产后续的访问进行权限和策略的配置。

以银行的数据分类分级为例,银行的分类分级标准包含四个层级,超过 200 个数据类型,如果通过人工把几十万字段打到对应的四级标签下,工作量非常庞大。同时,银行各类数据分布在不同部分,跨团队协作非常困难,导致效率低下。为了解决上述问题,星环科技在 Defensor 4.0 版本预制了金融行业的分类分级大模型,可以做到开箱即用,自动化、智能化地帮助企业做分类分级。引入大模型后,分类分级的准确率有较大的提升。

星环科技Defensor 4.0:大模型驱动的数据安全管理平台

图中展示了大模型分类分级的流程,首先对元数据字典做预处理,进行语义的加工、中文的扩写以及短语的规范化。在此基础上,引入基于金融行业预训练的微调大语言模型,对他的背景进行预测,再对四级子类做精准预测,确保某一个字段能归到对应的、正确的二级大类下的四级子类。最后,对于异常的、错误的知识点,Defensor 也引入了增强效果反馈系统,通过少量人工补录的流程,可以形成一个模型的迭代,再做一次预训练,同时慢慢形成高质量、高可用、准确率高的金融行业分类分级大模型。

下图是引入大模型之后分类分级的效果对比图,其中时间缩短到原本的10%,准确率相比传统机器学习提升 50%,单位人力成本降低 80%。

星环科技Defensor 4.0:大模型驱动的数据安全管理平台

该模型框架也适用于其他行业、其他领域的分类分级工作,我们只需要给模型提供一点知识、一点样本数据,就可以帮助企业做到智能化的分类分级和资产盘点,并最终出具一个分类分级的清单报告。

事中阶段,根据策略做到事中阻断或动态脱敏

星环科技Defensor 4.0:大模型驱动的数据安全管理平台

梳理好企业的敏感资产之后,需要对敏感资产进行安全防护,这是数据安全防护的最终目的。目前,企业数据脱敏场景普遍存在如下痛点:

第一,企业测试环境经常需要从生产环境取数,满足日常 APP开发要求。这种情况下,敏感数据需要进行脱敏,面对测试环境和生产环境中跨越脱敏的情况,由于企业的数据量越来越膨胀,会出现大量数据脱敏太慢的问题。

第二,企业需要精确定义脱敏数据的范围,比如基于时间分区的表,需要脱敏一个月还是一周的数据,如何精确定义脱敏数据的范围,也是一个亟待解决的问题。

第三,数据脱敏之后,如何保证下游业务能够顺利使用?脱敏之后,数据本身的业务价值会一定程度的变少,或者导致业务系统无法使用脱敏之后的数据,我们面临如何保证数据脱敏后业务继续正常运作的难题。

第四,实时防护场景,比如对实验室的分析是及时的查询,而且会牵扯到多表的关联查询。这种情况下,传统的静态脱敏流程时间太长、实时性不够,而且有多角色、多用户体系,如何做防护是一个问题。

针对上述问题,Defensor 都提供了相应的能力。

在大数据量脱敏场景中,星环科技依靠分布式高性能计算的数据积累,提供了高性能分布式脱敏产品方案。Defensor 脱敏引擎是分布式框架,支持节点横向扩展。以银行为例,星环科技的分布式脱敏引擎与现有脱敏系统相比,从数据的导入、脱敏到卸数,再导回到原来的系统,效率提升10倍。

面对下游业务无法使用问题,Defensor 提供了丰富的脱敏方法。对于数值类数据,统计脱敏算法能保证数据的数学特征,比如最大值、最小值、平均值。而仿真脱敏,能保证脱敏后的数据依旧保持数据的特征,比如姓名、身份证、邮箱、地址等。同时,Defensor 还具备差分隐私能力,在数据探索场景下,需要对原始数据进行保护,引入差分隐私对数据进行噪声,可以解决差分攻击。

针对实时查询的动态防护,Defensor提供企业级统一的数据安全访问策略中心。基于数据安全的整体设计框架,为全域、全生命周期的安全防护建立最基础最可靠的安全策略中心:为星环科技及第三方数据平台、数据库、中间件等相关产品提供统一的数据安全策略,从而形成整体的数据防护和敏感监测等能力:新版本支持细粒度数据库用户行列权限配置,可直接下发到Inceptor/ArgoDB/KunDB,实现库内安全访问。

事后溯源,敏感数据行为监测与审计

星环科技Defensor 4.0:大模型驱动的数据安全管理平台

在事前可知、事中可控的阶段,Defensor 提供了分类分级、敏感数据合规使用、安全策略制定与下发等能力。在这两个阶段我们帮助企业梳理了敏感资产清单,并且制定一系列敏感资产防护策略。但是这些能力是否落实到位,就需要审计溯源工具。首先,通过收集企业数据库审计日志或者镜像流量,拉到数据安全审计工具里面来,通过预定规则进行分析。

比如,基于用户、时间或者设备IP的维度去规定企业有哪些人,哪些设备,哪个时间段访问企业敏感资产,一旦发现违规敏感资产访问,立刻告警,同时还会跟预定策略进行匹配,如果敏感资产访问没有按照预先设定好策略执行,就是高危风险操作,会及时发出邮件告警,告警之后提供相关日志的解锁和关联分析能力,去判别风险事件发生上下文的历史事件进行追溯,达到事后溯源的目的。

星环科技安全审计产品的核心竞争力在于,我们用到了数据库对于 SQL 解析的能力,一个 SQL 语句我们可以解析出这个SQL所包含操作的库、表、列以及它的关联度的库、表,再跟之前分类分级结果进行比对,就可以知道这个SQL语句到底有没有访问到企业数据库里的敏感字段,再通过白名单机制,对敏感字段做安全的事后防护。

继续阅读