上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
世界是个数据矿
和谷歌整合全球信息的目标相比,对于消费者记录、航班价格和库存的太字节挖掘显得不值一提。据说,谷歌有5拍字节的存储容量。这相当于5,000太字节(1000万亿字节)。乍一看,搜索引擎与数据挖掘似乎没有太大关系。谷歌为互联网上的所有词语制作了索引。如果你搜索“金橘”,谷歌会直接向你发送使用这个词语次数最多的所有网页列表。不过,为了帮助你找到你真正想要的金橘页面,谷歌会使用各种超级数据分析方法。
谷歌开发了个性化搜索功能,用你过去的搜索历史更加精确地猜测你的想法。如果比尔·盖茨(Bill Gates)和玛莎·斯图尔特②(Martha Stewart)分别搜索“黑莓”,那么盖茨很可能会在结果列表最前面看到关于电子邮件设备的网页,而斯图尔特很可能会看到关于水果的网页。谷歌正在将这种个性化数据挖掘应用到它的几乎每一项功能中。新的谷歌网络加速器可以极大地提高互联网访问速度,这不是源于硬件或软件技术的某种突破,而是通过预测你接下来希望阅读的内容实现的。谷歌网络加速器不断从网络上预先提取网页。所以,当你阅读某篇文章的第一页时,谷歌已经在下载第二页和第三页了。在你明天早上启动浏览器之前,谷歌就可以通过简单的数据挖掘预测出你希望浏览的网站(提示:它们很可能是你在大多数日子里浏览过的网站)。
雅虎和微软正在这场分析竞争中拼命追赶谷歌的脚步。谷歌已经当之无愧地成了一个动词。坦率地说,谷歌极大地改善了我的生活,对此我很吃惊。不过,我们这些互联网用户并不是某个品牌的死忠。最能猜测我们心理的搜索引擎可能会赢得我们的大部分流量。如果微软和雅虎能够想办法在数据分析方面超越谷歌,它们就会很快取代它的位置。超级数据分析的胜利者将会获得网络流量带来的利益。