
上QQ阅读APP看书,第一时间看更新
1.2 思维变革之一:样本=总体
大数据时代的第一个转变,是要分析与某事物相关的更多的数据,有时甚至可以处理和某个特别现象相关的所有数据,而不再是只依赖于分析随机采样的少量的数据样本。
19世纪以来,当面临大量数据时,社会都依赖于采样分析。但是采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物。以前人们通常把这看成是理所当然的限制,但高性能数字技术的流行让人们意识到,这其实是一种人为的限制。与局限在小数据范围相比,使用一切数据为人们带来了更高的精确性,也让人们看到了一些以前样本无法揭示的细节信息。
在某些方面,人们依然没有完全意识到自己拥有了能够搜集和处理更大规模数据的能力,仍在信息匮乏的假设下做很多事情,假定自己只能搜集到少量信息。这是一个自我实现的过程,人们甚至发展了一些使用尽可能少的信息的技术。例如,统计学的一个目的就是用尽可能少的数据来证实尽可能重大的发现。事实上,人们形成了一种习惯,那就是在制度、处理过程和激励机制中尽可能地减少数据的使用。