不管我们是否承认,也不管我们是否愿意,我们已经进入了大数据时代。维克托.迈尔-舍恩伯格和肯尼斯.库克耶教授在《大数据时代》里用丰富翔实的例子告诉了我们这一点。
“一天,一个男人气冲冲闯进位于明尼阿波利斯市郊的塔吉特商店,要求经理出来见他,指责商场给还在读高中的16岁的女儿邮寄婴儿服和婴儿床的优惠?唬??粕痰甑淖龇ㄊ窃诠睦????吃小?墒牵?柑旌缶?泶虻缁跋蛘飧瞿腥酥虑甘保?飧瞿腥说挠锲?幢涞闷胶推鹄矗?蹈门??丫?吃辛耍?弥虑傅娜耸撬?约骸T?垂?居凶约旱氖?莘治鐾哦樱?褂么笫?菹喙胤治鲆延卸嗄辏??歉?菖?韵?鸭锹急冉献既返卦げ庠げ?冢?庋?芄辉谠衅诘拿扛鼋锥胃?突?嘤Φ挠呕?弧4中牡母盖酌挥蟹⑾峙??缫鸦吃校?炊?鸨干碳业木俅搿!
正如书中所述,一个东西出故障不是瞬间的,而是一个渐变的过程。通过收集相关数据,可以预先捕捉到故障的信号,继而可以事先采取措施预防。大数据时代,我们可以“通过找出一个关联物并监控它,预测未来”。
通过书中所给的大量例子可以看出,大数据时代,海量的数据分析被广泛运用于商业、交通、公共卫生、企业管理和教育部门,它在悄然改变着我们的生活、工作与思维。正如马云所说,大家还没搞清PC时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。
大数据时代,需要的数据不再是随机抽样而是全体数据。这样,忽视了精确性,但也避免了随机采样过程中存在的偏见和对某些细节进一步分析的忽视。与小数据分析相比,混杂和模糊是海量的大数据分析的亮点而不是缺点。因为根据统计,只有5%的数字数据是结构化的且能适用于传统数据库,不过不接受混乱,剩下的95%的非结构化数据就无法被利用,比如网页和视频资源。通过接受不精确性,我们打开了一个从没有涉足的世界的窗户。文章引用了微软数据设计专家帕特.赫兰德的“略有瑕疵的答案并不会伤了商家的胃口,因为他们更看重高频率”。和谷歌前任首席信息官道格拉斯.梅里尔的“宽容错误会给我们带来更多的价值”来说明这一点。
凡事皆有利有弊,任何高科技都是双刃剑,大数据分析也不例外。在一切都可以量化的大数据时代,也有许多问题值得我们思考和应对。
大数据时代,冷冰冰的数据代替了一切。人们丧失了个人隐私。无处不在的“第三只眼”着实令人恐怖和烦恼,亚马逊监视着我们的购物习惯,百度监视着我们的网页浏览习惯,而微博、微信、QQ似乎什么都知道。你会不时收到一些不想看到的短信、邮件、广告等等,人肉搜索无所不能,个人的隐私都被裸露在光天化日之下,这严重违背了强调个人意志,以人为本的理念。
更为严重的是,低俗的媒体、网站和个人很容易利用便利践踏人的尊严、诽谤人的荣誉。不能保证尝到大数据益处的人把大数据用到不该用的地方。
然而,毋容置疑,无论愿不愿意,每个人被置身于大数据时代中,它在改变着我们的生活、工作和思维。怎样鼓励其增长,遏制其危害是亟待解决的课题。需要建立新的法律使收集和使用数据的人为其行为承担责任,而不是也不能阻止大数据的发展。