星环科技Defensor 4.0：大模型驱动的数据安全管理平台

5月26日向星力•未来数据技术峰会上，星环科技数据安全管理平台 Defensor 发布 4.0 版本，新版本引入大模型，可实现智能化自动化分类分级，帮助企业盘点敏感资产。同时，Defensor 联合星环科技数据 API 安全网关 Midgard、数据库监测与审计软件Audit 等数据安全产品可帮助企业构建事前可知可防、事中可控、事后可查的全链路数据安全防护体系。

事前可知，基于大模型的智能化分类分级

事前阶段，Defensor 可以帮助企业梳理敏感资产，形成敏感资产清单，同时明确敏感资产分布情况，并对敏感资产后续的访问进行权限和策略的配置。

以银行的数据分类分级为例，银行的分类分级标准包含四个层级，超过 200 个数据类型，如果通过人工把几十万字段打到对应的四级标签下，工作量非常庞大。同时，银行各类数据分布在不同部分，跨团队协作非常困难，导致效率低下。为了解决上述问题，星环科技在 Defensor 4.0 版本预制了金融行业的分类分级大模型，可以做到开箱即用，自动化、智能化地帮助企业做分类分级。引入大模型后，分类分级的准确率有较大的提升。

图中展示了大模型分类分级的流程，首先对元数据字典做预处理，进行语义的加工、中文的扩写以及短语的规范化。在此基础上，引入基于金融行业预训练的微调大语言模型，对他的背景进行预测，再对四级子类做精准预测，确保某一个字段能归到对应的、正确的二级大类下的四级子类。最后，对于异常的、错误的知识点，Defensor 也引入了增强效果反馈系统，通过少量人工补录的流程，可以形成一个模型的迭代，再做一次预训练，同时慢慢形成高质量、高可用、准确率高的金融行业分类分级大模型。

下图是引入大模型之后分类分级的效果对比图，其中时间缩短到原本的10%，准确率相比传统机器学习提升 50%，单位人力成本降低 80%。

该模型框架也适用于其他行业、其他领域的分类分级工作，我们只需要给模型提供一点知识、一点样本数据，就可以帮助企业做到智能化的分类分级和资产盘点，并最终出具一个分类分级的清单报告。

事中阶段，根据策略做到事中阻断或动态脱敏

梳理好企业的敏感资产之后，需要对敏感资产进行安全防护，这是数据安全防护的最终目的。目前，企业数据脱敏场景普遍存在如下痛点：

第一，企业测试环境经常需要从生产环境取数，满足日常 APP开发要求。这种情况下，敏感数据需要进行脱敏，面对测试环境和生产环境中跨越脱敏的情况，由于企业的数据量越来越膨胀，会出现大量数据脱敏太慢的问题。

第二，企业需要精确定义脱敏数据的范围，比如基于时间分区的表，需要脱敏一个月还是一周的数据，如何精确定义脱敏数据的范围，也是一个亟待解决的问题。

第三，数据脱敏之后，如何保证下游业务能够顺利使用？脱敏之后，数据本身的业务价值会一定程度的变少，或者导致业务系统无法使用脱敏之后的数据，我们面临如何保证数据脱敏后业务继续正常运作的难题。

第四，实时防护场景，比如对实验室的分析是及时的查询，而且会牵扯到多表的关联查询。这种情况下，传统的静态脱敏流程时间太长、实时性不够，而且有多角色、多用户体系，如何做防护是一个问题。

针对上述问题，Defensor 都提供了相应的能力。

在大数据量脱敏场景中，星环科技依靠分布式高性能计算的数据积累，提供了高性能分布式脱敏产品方案。Defensor 脱敏引擎是分布式框架，支持节点横向扩展。以银行为例，星环科技的分布式脱敏引擎与现有脱敏系统相比，从数据的导入、脱敏到卸数，再导回到原来的系统，效率提升10倍。

面对下游业务无法使用问题，Defensor 提供了丰富的脱敏方法。对于数值类数据，统计脱敏算法能保证数据的数学特征，比如最大值、最小值、平均值。而仿真脱敏，能保证脱敏后的数据依旧保持数据的特征，比如姓名、身份证、邮箱、地址等。同时，Defensor 还具备差分隐私能力，在数据探索场景下，需要对原始数据进行保护，引入差分隐私对数据进行噪声，可以解决差分攻击。

针对实时查询的动态防护，Defensor提供企业级统一的数据安全访问策略中心。基于数据安全的整体设计框架，为全域、全生命周期的安全防护建立最基础最可靠的安全策略中心：为星环科技及第三方数据平台、数据库、中间件等相关产品提供统一的数据安全策略，从而形成整体的数据防护和敏感监测等能力：新版本支持细粒度数据库用户行列权限配置，可直接下发到Inceptor/ArgoDB/KunDB，实现库内安全访问。

事后溯源，敏感数据行为监测与审计

在事前可知、事中可控的阶段，Defensor 提供了分类分级、敏感数据合规使用、安全策略制定与下发等能力。在这两个阶段我们帮助企业梳理了敏感资产清单，并且制定一系列敏感资产防护策略。但是这些能力是否落实到位，就需要审计溯源工具。首先，通过收集企业数据库审计日志或者镜像流量，拉到数据安全审计工具里面来，通过预定规则进行分析。

比如，基于用户、时间或者设备IP的维度去规定企业有哪些人，哪些设备，哪个时间段访问企业敏感资产，一旦发现违规敏感资产访问，立刻告警，同时还会跟预定策略进行匹配，如果敏感资产访问没有按照预先设定好策略执行，就是高危风险操作，会及时发出邮件告警，告警之后提供相关日志的解锁和关联分析能力，去判别风险事件发生上下文的历史事件进行追溯，达到事后溯源的目的。

星环科技安全审计产品的核心竞争力在于，我们用到了数据库对于 SQL 解析的能力，一个 SQL 语句我们可以解析出这个SQL所包含操作的库、表、列以及它的关联度的库、表，再跟之前分类分级结果进行比对，就可以知道这个SQL语句到底有没有访问到企业数据库里的敏感字段，再通过白名单机制，对敏感字段做安全的事后防护。

星环科技Defensor 4.0：大模型驱动的数据安全管理平台

继续阅读

数据安全服务前十企业名单揭晓中睿天下荣登榜单

筑牢红线，常抓不懈：碧桂园安全管理体系行之有效

python解析word拆分Excel选择题格式(3、判断题)

巧妙平衡数据安全与业务可用之间的“度”

牟承晋：数据安全是网络化信息安全的核心

【法律知识小科普】——"网络隐私保护：个人数据安全指南"

Word | 【制度】一整套消防安全管理制度规程范本

知道创宇受邀探讨基于网空测绘的资产安全管理获《保密科学技术》重磅推荐...

4.29闭幕｜知道创宇六大行业网安建设分享集锦

ISO/IEC 27018公有云中个人身份信息管理体系认证概述

#荣耀MagicV2#荣耀MagicV2是一款功能强大的智能手机。它采用了最新的技术，提供了许多令人印象深刻的功能。荣耀

自定义报头协议

德国为何做的这么强大？原因是这个……

数据库设计报告——用教材管理系统来举例数据库设计文档通用模板

中国网络安全能力图谱(2020.9)公布，中安威士多款产品受到认可

软考-软件设计师笔记五（系统安全分析与设计）信息系统安全属性对称加密技术非对称加密技术信息摘要数字签名数字信封与PGP各个网络层次的安全保障网络威胁与攻击防火墙技术