引导语:时代的发展,让当今社会成为了信息时代,来看看本文吧!
头一回在美国上统计课,在国内门做过近10年数据统计工作的涂子沛觉得“眼前一亮”。这一讲的内容是统计学的意义。印度裔教授一本正经地对学生们说:“除了上帝,任何人都必须用数据来说话。”
教授的观点一下子震撼了涂子沛。在他的印象中,数据往往被当成论证工具,更像是一种“证明领导意图的手段”。但在这里,“数据”似乎有另外的含义。
2007年底,奥巴马访问谷歌总并做了演讲:
“知道的越多,官员才可能更加负责任……我将把联邦的相关数据用通用的格式推上互联网。我要让公民可以、查询的资金、合同、专门款项和游说人员的信息。”
涂子沛记得,演讲在此时被热烈的掌声所打断。
这是涂子沛第一次将“公民权利”这样的大词与“数据”联系起来。也正是从那时起,这个从卡内基·梅隆大学毕业,并已经在一家美国公司就职的数据库程序员萌生了一个系统的写作计划。2012年7月,他的《大数据》一书出版,扉页上的题记别具一格:“一个真正的信息社会,首先是一个公民社会。”
大数据时代
涂子沛在美国匹兹堡市一家联邦的合同商公司做程序员,每天面对的东西就是数据、代码以及大大小小的表格。
20世纪70年代初,涂子沛出生在一个法官家庭。因为从小看父亲断案,他很早就开始思考什么是“正义”这样的大问题。90年代中期,他进入华中理工大学读书。学校里有“人文讲堂”的讲座活动,这个计算机专业的学生是其最忠实的拥趸之一。时任大学副校长的谢韬也来讲过,当时他给涂子沛签名并留下这样一句赠语:“要做新世纪的者。”如今年已不惑的涂子沛仍然保留着这份情怀。当看到“7·21”北京暴雨的新闻后,他连夜写了一篇介绍美国如何发布气象灾害信息的文章。
“没有有效的预警,再准确的数据预报也是一个零。”涂子沛介绍,美国天气不仅开通了推特、脸谱等社交媒体账号,还推出了一个叫做“天气收音机”的预警产品,一旦发出气象预警,平时沉默不语的“收音机”会立刻变为“闹钟”。
涂子沛慢慢意识到,原来自己一直关心的“公平正义”,竟然与每天朝夕相处的数据有着如此紧密的联系。
在此之前,和大分人一样,涂子沛更愿意从技术层面去关注什么是“大数据”——这是对信息爆炸时代的崭新描述,它的基本单位是“太”(TB),而1000个“太”则等于一“拍”(PB)。打个直观的比方,美国国会图书馆是世界上最大的图书馆之一,它所有印刷品的信息量加起来只有15太,而全美国仅在2010年一年的新增数据量就足足有3500拍。
麦肯锡咨询公司曾做出估测,未来数据仍会以每年50%的速度增长,需要大量拥有“深度分析数据”专长的工作者。涂子沛便是其中之一。他会在自己的专栏中记录那些数据改变商业的故事:沃尔玛的研究人员通过数据挖掘,发现四成左右的年轻爸爸在购买婴儿尿布时会顺手买点啤酒犒劳自己,便对这两种商品进行了捆绑销售,结果销售量双双增加。更夸张的事例是,一个高中女孩某天突然收到了超市寄来的婴儿服广告,其父大为光火,但就在超市公开道歉几天后,这位父亲发现自己的女儿真的怀孕了。原来,超市已经可以通过顾客的食品消费数据做出趋势判断。(经典语录 www.wenzhangba.com)
但当涂子沛开始写作《大数据》时,商业已经不再重要,他想讲述一个数据与正义的故事。
信息之于民主,就如货币之于经济
2009年1月17日,美国新任总统奥巴马签署了他的首份总统备忘录《透明和的》。
120天后,一个叫做Data.gov的网站正式上线,这是一个数据的门户网站,旨在全面美国联邦拥有的数据。
项目的负责人是维伟克·昆德拉——美国历史上的第一位首席信息官,他说:“这是一场数据民主化的运动,我们正在把信息的力量放到美国手中。”
起初,这个数据网站有点名不副实,即使包括地理数据在内,这个新生网站也仅仅只有47组数据和27个数据分析工具。要知道,年轻的首席信息官要面对的,“是一种沿袭了上百年的行政文化。面对庞大的公共信息,官员的第一反应往往是安全第一、保密为上”。尽管早在之初,《独立宣言》的起草人之一、美国第3任总统托马斯·杰斐逊就曾说:“信息之于民主,就如货币之于经济。”但事实上,在美国200多年的历史中,信息的雄心并不多见。
1789年,美国国会制定了《管家法》,规定了行政机关必须在统一的出版物上公开政务信息,但对于公开的内容,行政长官有自由裁定权。进入20世纪后,规模不断膨胀,国会先后通过了《联邦登记法》和《行政程序法》,规定公众可以向提出信息公开的要求,但如果危及公共利益,有权拒绝。
简言之,信息是否公开,还是说了算。到了1951年,在当时的冷战格下,“保密”之风蔓延一时。
同一时期,哥伦比亚大学的新闻学教授克劳斯对当时的信息管理情况进行了调研,并出版了《的知情权》一书。他在书中明确提出:只有拥有信息自由,才能真正拥有对公共事务的发言权。后来,这本书被誉为美国信息自由运动的“圣经”。
书出版的那一年,一个叫约翰·摩斯的新任国会议员提出了《信息自由法》草案。摩斯任职25年,经历了数任总统,然而即使以开明著称的肯尼迪,也对这个草案避犹不及。约翰逊在听到这个草案后的第一反应则是:“摩斯想干什么?他想搞砸我这届吗?”
直到1964年,摩斯的提案才进入辩论阶段。那时候的联邦有27个门,无一例外地在听证会上大声反对。
1966年,由于参众两院对该法案的支持率都高于三分之二,无法动用否决权的总统约翰逊在家中签署了这份法案。
多年后,被称为“《信息自由法》之父”的摩斯回顾说:“我们所做的,只是一个开始。那最好的仗,我已经打过。”
Data.gov的出现则为信息公开的发展注入了新的活力。昆德拉在演讲中表示,数据作为一项公共资源,应该像天气预报、体育赛事和股票信息一样实时公开。
充满了挑战性的新事物同样引发了联邦各门头头脑脑的忧虑。有人担心,万一民间机构根据原始数据分析出的结论与不一样,岂不是“搬起石头砸自己的脚”?还有人认为,这场面对全世界的数据运动,会在不知不觉间让利益受到损害。