Datensparsamkeit

2013年12月12日

Datensparsamkeit是一个很难正确翻译成英语的德语单词。这是一种我们如何捕获和存储数据的态度,即我们应该只处理我们真正需要的数据。

这些天来,围绕着大数据的概念有很多的炒作,随之而来的是我们应该捕捉并存储我们能得到的每一点数据的概念。我们可能不能立即使用用户存储在其地址簿中的联系方式,但我们无论如何都会请求它,以防将来有用。我们会记录下我们网站上的每一次点击,并将其储存起来,以防我们以后想要搜索它。我们设置了智能手机应用程序来询问位置信息,这样以后如果我们想出某种方法来使用这些数据,我们就可以。毕竟,存储是便宜的,所以为什么不呢?

这种“包罗万象”的方法的问题在于,它引发了严重的隐私问题。即使我们相信自己不会滥用收集到的数据,每个数据存储都是犯罪分子或政府监控机构的目标。这一问题在德国尤其严重,历届政府都对公民进行了广泛的监视,以控制他们。因此,德国有强有力的数据隐私法。

Datensparsamkeit[1]是来自这些隐私法的一个概念,它与“捕捉一切事物”的哲学相反。翻译并不简单(这就是为什么我保留了这个德语单词),但大致上可以翻译为“data紧缩”、“data minimization”、“data parsimony”或“data frugal”。[2].这意味着您应该经常问自己为什么要捕获或存储数据,并且只处理所需的最小数量的数据。

这方面的一个例子是跟踪您的网站上的用户,以确定您有多少独立访问者。如果同一个人在几个小时内访问了多个页面,您希望将其算作一次访问。如果他们一个月来几次,你仍然只想把他们算作一个单独的访客。一种方法是记录IP地址,将每个IP地址计算为一个人[3].但是IP地址很能说明问题,它的用途远不止统计访问者。Datensparsamkeit建议您不应该直接存储IP地址,而应该对其进行散列,并只存储散列。

一个涉及IP地址的类似示例是使用IP地址来推断地区和国家等人口统计信息。您可以通过记录IP地址的前三个字节来获得这些信息并练习datensparsamkeit。

Datensparsamkeit不仅仅是关于坏人窃取数据,它还涉及到你与主要公司本身的关系。目前的默认态度是,您生成的任何数据不仅可以被捕获者自由使用,而且还会成为他们有价值的商业财产。包括我在内的隐私倡导者认为,这种假设需要改变。公司应该只获取他们需要的东西,证明需要的重担应该落在他们身上。此外,当然,它们必须完全透明地显示它们捕获的内容、存储的内容以及它们与谁共享数据。任何违反数据安全的行为都必须立即公布(而不是掩盖,这是目前的默认做法)。

即使你不同意我关于个人控制我们自己的数据的观点,安全漏洞的风险意味着约会是一个明智的行动。如果你持有你不需要的数据,有人偷了它并造成损害,你不应该为这种损害负责吗?即使没有法律责任,宣传也会带来严重的后果——因此,对于那些不实践“约会搭讪”的人来说,也是有风险的。

确认

Erik Dornenburg把我介绍给Datensparsamkeit。“……所有的事情”似乎一直存在(至少十年),所以我很高兴Korny Sietsma教会了我这一点它始于2010年

笔记

1:这里有一些帮助发音

2:自从我最初写这篇文章以来,这个原则得到了更多的关注,特别是随着欧盟GPDR规则的引入。在这种情况下,我越来越多地听到被称为“数据最小化”的概念。我暂时保留这一页的原始名称。

3:我意识到网络地址转换比这要复杂得多,但我想要一个简单的例子。