阿拉善盟 【切换城市】

首页 > 热点资讯 >新闻内容

数据脱敏——什么是数据脱敏

2021年06月02日 12:06

一、什么是数据脱敏


数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。

百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。

生活中不乏数据脱敏的例子,比如我们最常见的火车票、电商收货人地址都会对敏感信息做处理,甚至女同志较熟悉的美颜、有些视频中的马赛克都属于脱敏。


二、为什么要进行数据脱敏


上面说到,在“涉及客户安全数据或者一些商业性敏感数据的情况下”对数据进行改造,说明我们要进行改造的数据是涉及到用户或者企业数据的安全,进行数据脱敏其实就是对这些数据进行加密,防止泄露。

对于脱敏的程度,一般来说只要处理到无法推断原有的信息,不会造成信息泄露即可,如果修改过多,容易导致丢失数据原有特性。因此,在实际操作中,需要根据实际场景来选择适当的脱敏规则。改姓名,身份证号,地址,手机号,电话号码等几个客户相关字段。

三、如何实现数据脱敏


按照脱敏规则,可以分为可恢复性脱敏和不可恢复性脱敏。可恢复性脱敏就是数据经过脱敏规则的转化后,还再次可以经过某些处理还原出原来的数据,相反,数据经过不可恢复性脱敏之后,将无法还原到原来的样子,可以把二者分别看做可逆加密和不可逆加密。

我们目前遇到的场景是日志脱敏,即在把日志中的密码,甚至姓名、身份证号等信息都进行脱敏处理。

脱敏前:


脱敏后:

如上图,仔细分析会发现,打日志之前,获得脱敏的数据就两个步骤:【拿到要输入的数据(user实体)】→【进行序列化】,所以要进行数据脱敏可以考虑在这两个步骤上进行实现。第一个方法就是在序列化实体之前先把需要脱敏的字段进行处理,之后正常序列化;第二个方法就是在实体序列化的时候,对要脱敏的字段进行处理。


相关推荐

从“红皇后假说”看互联网时代的商业竞争

生态学中有一个“红皇后假说”,此假说源自英国作家路易斯·卡洛尔的《爱丽丝镜中奇遇记》。书中的红皇后对爱丽丝说:"在这个国度中,必须不停地奔跑,才能使你保持在原地。"这一法则在自然界的猎豹与瞪羚中体现的淋漓尽致。对于猎豹一族来说,在一代又一代的进化中,它们拥有了坚韧的脊椎、强劲的长腿、钉鞋般的爪子和流畅的体形,有着时速约110公里的迅捷身手,大大优异于他们的祖先,然而猎豹一族吃掉的羚羊数却并没有比以前的祖先多。因为与此同时,羚羊一族也在不断进化,为了不被吃掉跑的更快。就这样在时间的维度里,猎豹和瞪羚都被栓在红色皇后的跑步机上,跑得慢的猎豹会饿死,跑不快的羚羊会被吃掉。两方都在不断地进步,留存下来的都是精锐中的精锐。正如中国那句古话“逆水行舟,不进则退”。“红皇后假说”同样适用于当下的商业市场。面对持续发展的竞争对手,如果自身无法跟进发展的脚步,就只有被市场淘汰的结局。在疫情期间,传统的线下销售受到了巨大冲击,餐饮行业首当其冲。不少传统餐饮行业都开始利用互联网促进自身发展。后疫情时代,租客惠就为餐饮业复产复业,斥资2000万,免费为1万家餐饮企业提供点餐系统,让餐饮业拥抱互联网,助力餐饮业再创辉煌。租客惠云餐饮系统简介租客惠隆重推出整合营销功能的免费互联网SAAS餐饮点餐系统!租客惠属于租客网旗下点餐系统,商家入驻点餐系统,即可共享两亿租客网租客资源。1、租客惠的扫码点餐方式多样,小程序、公众号、浏览器、APP均可多端扫码点餐。而且支持多种平台:PC端(仅支持商家,方便管理),安卓APP,IOS,小程序,微信公众号,PAD端。2、对于消费者也有灵活的收款设置:可以线下收款,可以平台收款,支持微信,支付宝等。方便商家和消费者。3、其中商家拥有独立端口:包括店长账号,服务员账号,厨师账号,可以独立设置各个身份的相关工作权限。方便管理。4、商机还可以通过系统得到互联网数据中的人性化的统计报表:销售额统计,销售量统计,单品销售量统计,最佳销售量统计。便于统计和结算。5、点餐系统还拥有智能报警功能:菜量报警功能,库存报警功能,人员偏离报警功能,智能高效。6、商家还可以通过系统进行固定资产管理,设置特色菜品推荐,特价推荐。灵活的店铺设置功能,助力商家全方位把握店铺。1、档案管理:资产档案,人员档案2、信息推送功能:点单信息提醒,让服务人员不丢每一单。3、人员管理功能:考勤管理,轨迹管理(外出)4、进销存管理:供应商管理,库存管理,销售关联,可以对应菜单及厨师填写的菜单用料表,自动计算并对比应剩余库存等。同时对库存量有报警设置。5、客户会员管理:客户会员属于商家自有,轻松建立客户流量池,客户关系管理。6、独立的活动设置权限:可自己设定优惠券,设定红包规则,设定返现规则,针对特种客户个性化优惠等。7、灵活的点餐管理:支持大厅按桌号点餐管理、包房设置管理、拼桌管理、远程订餐管理,以及外卖管理。租客网承诺,加盟租客惠平台不收取商家的入驻费用。商家不用经过平台收款,只需使用点餐系统,用商家独立的收款码也可以收款。付款秒到账,收款不扣点。租客惠点餐系统,众多商家的更优选择!

2021年06月03日 10:00

优联互通营销优势!

在优联互通,新闻稿发布只需三大步骤。即新闻稿写作,选择新闻发布平台选择、最后就是发布新闻,整个过程只需2-3个工作日即可。新闻稿创作:企业营销新闻稿的创作不同于传统新闻,需要将企业的营销信息巧妙的融入到有价值的新闻事件中,写成一篇质量上乘的新闻软文。以新闻软文的方式进行企业宣传,能够有效降低目标用户反感度,增加阅读率。选择新闻发布网站:网站是新闻的展示平台,企业要想使自己的新闻稿件能够得到更为广泛的传播,就必须选择权重高、流量大的新闻媒体网站。如新浪网、网易网、腾讯网、搜狐网、一点资讯、今日头条等。发布新闻稿:这是新闻稿发布的最后环节,同样也是最重要的一个步骤。发布新闻稿需要找专业的新闻营销推广公司代为发布。国内最大的新闻稿件发布平台,拥有上千家网络媒体资源,基本涵盖国内各大主流门户网站、行业网站、自媒体平台、新闻源等。通过内部新闻发布系统以及24小时全天候待命的新闻稿件发布团队,能够确保将企业的营销新闻在第一时间发遍全网络。此外,优联互通还可提供额外保障和服务,可享受软文覆盖、网站反链接服务,增加客户网站权重、迅速增加新闻曝光度,获取流量。另外如新闻稿发布不成功,可申请更换同类型媒体。以上就是优联互通为大家提供的关于“超实用营销收藏”的相关介绍,相信你对新闻稿件也有所了解。想要让软文获得该方面的营销效果,在选择平台发布时候要选择正规有价值效果的发稿平台,优联互通是一个优质的选择。优联互通经过15年时间累积,合作媒体资源囊括了众多不同种类的网站,服务客户涵盖150多个行业,获得了客户的广泛好评。优联互通营销优势:1、自有资源,更多优惠。优联互通自有几十多家媒体网站,涵盖中国南方新闻网、投交所、考生网、中国商业周刊等不同种类,可提供精选性价比套餐,保障收录率的同时,可以给予比其他平台更优惠的价格;2、自由团队,更高效率。优联互通有稳定的开发团队,曾自主研发抖音运营系统、万词霸屏系统、搜索引擎关键词上首页系统等,熟知互联网算法,能帮助企业更高效的实现快速霸屏,实现秒曝光;高端营销推广平台,认准优联互通!

2021年01月13日 11:05

如何利用伪原创增加自己网站的原创文章

网站在SEO优化中是大家在日常都会做到的工作,而这里面的工作重点就是写原创文章,但对于没有文字功底的网站工作人员来说,写作便是种笔尖上的噩梦,为了解决这个难题,很多小伙伴便把精力集中在了写伪原创,那么什么才是真正的伪原创呢?百度又是如何评判文章的质量呢?要想弄明白这个道理要知道伪原创的定义,百度百科给的定义是:伪原创是指把篇原创的文章进行再加工,使其让搜索引擎认为是篇原创文章,从而提高网站权重。编辑方法有修改标题的关键词和首尾段落总结两种。既然知道了伪原创的定义,那么下面小编和小伙伴们起来分析下,如何写高质量的伪原创,其实所谓的高质量伪原创是将已经发布的片旧的文章经过我们人为的调整改动,又将其发布于网络,同时又巧妙的躲避百度蜘蛛的检索规则,使其认为是篇原创文章,看到这里,我想小伙伴都应该明白做伪原创的精髓在哪里了,我们要做的内容是如何躲避蜘蛛的层层审核,使其认为是篇原创文章。那么问题来了?这些和伪原创又有什么关系呢?其实其中的原理都是相同的,只不过发展到,其数据演变为云计算,功能更加便捷快速而已,下面给大家说下搜索引擎的爬行原理,以此来指导我们写出更好的伪原创。搜索引擎的排名原理,第步要做的是爬行和抓取,以此完成蜘蛛的数据收集任务,步是蜘蛛的链接跟踪,其中将涉及深度优先法则与广度优先法则,第三步将是根据搜集数据建立地址库。第四步是预处理,很多人将此步骤定义为索引,其实这里有必要说明下,预处理包含众多规则,而索引只是预处理中重要的步骤,下面到了我们本次要说的重要的步骤,也是关系我们是否能成功处理伪原创的问题。预处理第步:文字提取,因为正常的网页中包含大量的标签,JS程序等无法用于排名的东西,所以第步将是把这些无法用于排名的东西统统处理干净,只剩下利于我们排名的文字,当然除了这些标签代码外,搜索引擎也会提取出些特殊的信息代码,例如富媒体替代文字等。部是:中文分词,中文分词是搜索引擎特有的步骤,搜索引擎处理页面及用户搜索都是以词为基础,英文等语言单词与单词之间有空格分隔,搜索引擎索引程序可以直接把句子划分为单词的集合。而中文词与词之间没有任何分隔符,个句子中的所有字和词都是连在起的。搜索引擎必须首先分辨哪几个字组成个词,哪些字本身是个词。第三步是:去停止词,无论是中文还是英文,语句中总会包含些嗯,得,的,and,or,the等词语,搜索引擎在索引页面之前会去掉这些词语,以减少无畏的计算。第四步是:消除噪声,绝大部分页面上都会包含对搜索排名没有贡献的些词语,这些词语也将统统被搜索引擎所CUT,接下来将是去重,正向索引,倒排索引,链接关系计算,特殊文件处理,后步是:排名。所以看到这里的小伙伴应该明白单纯的将篇原创文章拿来后经过修改标题,然后关键词植入是不会把搜索引擎蒙蔽的,更何况,XX搜索引擎接二连三的算法层出不穷,又增加了对句子,对段落的各种匹配模式,所以又增加了伪原创的难度,并且伪原创问题已经在各类搜索引擎中加入甄别算法,对核心关键词匹配度达到70%的将被认为为伪原创,并对词意进行分析,对词意相似度达到80%的将定义为伪原创。  作为我们这些辛苦的网站工作者,要做的是合理避开这些规则,让我们的伪原创成为真正的原创。让这些原创,真正的让百度收录,将会具有事半功倍的效果。

2020年04月04日 04:11