本书以《信息自由法》的提出、立法、完善为主线,串联起美国政府变迁、美国人民为信息自由而战的过程。
题记
一个真正的信息社会,首先是一个公民社会。
p8
数据不仅可以治国,还可以强国。
阳光是最好的防腐剂。路易斯.布兰戴斯
P13
除了上帝,任何人都必须用数据来说话。
信息至于民主,就像货币之余经济。
P35
很多情况下,“数据”和“信息”两个词经常替换使用。但严格的说,数据和信息这两个概念有很大的区别:数据是对信息数字化的记录,其本身并无意义;信息是指把数据放置到一定背景下,对数字进行解释、赋予意义。……但进入信息时代之后,人们趋向把所有存储在计算机上的信息,无论是数字还是音乐、视频,都统称为数据。
P42-43
程序和数据的关系,就好像发动机和燃料,所有的程序,都是靠数据驱动的;数据之于程序,又好比血液之于人体,一旦血液停止流动,人就失去了生命,代码也将停止运行。数据的生命力,甚至比程序更持久。程序可以不停地升级、换代甚至退出使用,但保存数据的数据库却会继续存在,其价值很可能与日俱增、历久弥新。
P42
最小数据集是指通过收集最少的数据,最好的掌握一个研究对象所具有的特点或一件事情、一份工作所处的状态,其核心是针对被观察的对象建立一套精简实用的数据指标。
P57
得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度很高,频度在不断增加,为社会科学的定量分析提供了极为丰富的数据。社会科学将脱下“准科学”的外衣,在21世纪全面迈进科学的殿堂。
P57
“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。
P58
大数据的影响,就像4世纪之前人类发明的显微镜一样。
P61
美国这个国家,虽然年轻,但相信数据、使用数据,却有着深厚的传统。 数据被视为科学的度量、知识的来源; 没有数据,无论是学术研究,还是政策制定,都寸步难行。
P69
一起交通事故的数据可能是无序的,一年的数据、一个地区的数据也看不出太多章法,但随着跨年度、跨地区的数据越来越多,群体的行为特点就会在数据上呈现一种“秩序、关联、稳定”,更多规律就会浮出水面。
P82
数据收集和数据分析必须成为基层部门的一种文化,一种管理哲学。
P100-102
图形是解决逻辑问题的视觉方法。……人的创造力不仅仅取决于逻辑思维,还取决于形象思维。数据可视化的技术,可以通过图像在逻辑思维的基础上进一步激发人的形象思维和空间想象能力,吸引、帮助用户洞察数据之间隐藏的关系和规律。
P109
大数据时代的竞争将是知识生产率的竞争。以发现新知识为使命的商务智能,无疑是这个时代最为瞩目的竞争利器。
P116-133
联邦政府这个庞大的数据帝国,是如何运作和管理的呢?
收集法则:减负,为人民减负
使用法则:隐私,文明社会的共识
发布法则:免费,人民已经交税
管理法则:质量,互联网时代的根本
P124
美国隐私权保护重心的变迁:
19世纪:以住宅为重心
20世纪:以人为重心
21世纪:以数据为重心
P136
早在几十年以前,政府所发布数据的质量问题就备受瞩目、广受争议。这是因为,这些数据,往往都关系到行业标准的设定。……每一项新标准的发布、老标准的调整,即使只有零点零几的变化,都可能影响一个行业的竞争、改变一个产业的布局。
P162
在信息时代,计算机内的每一个数据、每一片字节,都是构成一个人隐私的血肉。信息加总和数据整合,对隐私的穿透力不仅仅是“1+1=2”的,很多时候,是大于2的。
P214
开放数据是一石三鸟,不仅服务大众,刺激经济,还调动了大众创新,为政府节省了软件开发的开支。
P239
永远不要怀疑那一小部分有思想并且持续努力的公民能够改变这个世界,事实上,人类的历史从来都是这样。
P262
掌握信息多的人,在社会竞争中处于有利地位,而信息贫乏的人,则处于不利的地位。前者向后者有偿转让信息来获取利益,无偿出让则收获善意,只有信息自由流动,各方掌握相同的信息后,彼此才能建立完全的信任。
P263
如果把信息公开仅仅解读为公众对政府一种单方面的监督,是狭隘的、片面的,信息公开也是政府的一种自我保护。可以看到,政府通过信息公开有效地获得了社会的信任。
P302-303
和其他的生产要素相比,数据无疑有其独特的特点。例如,工业生产过程中的原材料,一般都有排他性,但数据很容易实现共享,而且使用的人越多,其价值越大;数据也不像机器、厂房,会随着使用次数的增多而贬值,相反,重复使用反而可能使它增值。此外,此数据和彼数据如果能有机地结合到一起,可能就会产生新的信息和知识,并且实现大幅增值。
P304
要做到“低成本、高效率”的运营以及决策正确,企业必须广泛推行以事实为基础的决策方法、大量使用数据分析来优化企业的各个运营环节,通过基于数据的优化和对接,把业务流程和觉得过程当中存在的每一分潜在的价值都“挤”出来,从而节约成本、战胜对手、在市场上幸存。
P307
基于数据的分析和竞争已经是零售业的常态,毫不夸张地说,零售业的竞争一定程度上已经成为一种基于数据的竞争,数据就是企业的财富和金矿,数据分析和挖掘能力就是企业的核心竞争力。
P313
在大数据时代,基于层级的社会控制手段将不再适用,基于流程的管理方法也有很大的局限性。……数据的开放和流动,就代表着知识的开放和流动,代表着权力的开放和流动,这种开放和流动,是多中心的、水平的。在这个时代,社会的主体结构将从“分层”转向“结网”,在网状传播的力量的不断冲击下,个人的主体价值将得到前所未有的张扬,集中在政府的权力将开始分散,权力的最终流向,是社会、是大众,是一个个独立的公民个体。大数据时代正在呼唤下一波社会化的浪潮:一个更开放的社会,一个权力更分散的社会,一个网状的大社会。
P325
今天的中国,是一个人口大国、互联网大国、手机大国,但却恰恰还不是一个数据大国。
P327-329
中国缺乏的不是可供收集的数据,也不是收集数据的手段,而是收集数据的意识。……中国人数据意识的淡薄,由来已久,甚至可以称之为国民性的一部分。
P333
收集数据、使用数据、开放数据,都是大数据时代我们中国人需要一一面对的挑战。这三大挑战,没有一个不是任重道远。但这些挑战,也是我们在大数据时代彻底摘掉“差不多先生”文化标签的重大历史机遇。如果在这个数据意义凸显的时代,我们还抓不住这些历史机遇,继续漠视数据、拒绝精准、故步自封,等待我们的,还将是一个落后的100年。
P333
由于互联网的发明,“开放”已经成为人类社会一个不可逆转、不断加速的社会思潮。如雨果所说:你可以阻挡一支入侵的军队,但你无法阻挡一种思想。在这个浩浩荡荡、不断前进的世界大潮当中,我们将发现,中国如果不跟上,我们的处境将会越来越微妙、越来越尴尬、越来越孤立。
P346
小数据只要在纵向上有一定的时间积累,在横向上有细致的记录粒度,再和其他数据整合,就能产生大的价值。从这个角度来看,大数据也可以理解为针对某个对象在时空两个维度上的“全息”数据。这种“全息”,在大数据的时代还表现为“多源”,即有多个源头在从不同方向对同一个对象进行数据记录,数据之间互相印证。
P350
在大数据的时代,开放数据的意义,不仅仅是满足公民的知情权,更在于让大数据时代最重要的生产资料、生活数据自由地流动起来,准确全面应用起来,以推动知识经济和网络经济的发展,促进中国的经济增长由粗放型向精细型转型升级。
P351
在大数据时代,公共决策最重要的依据将是系统的数据,而不是个人经验和长官意志……政府应加大数据治国的舆论宣传,将数据的知识纳入公务员的常规培训体系,力争在全社会形成“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的文化氛围和时代特点
网友评论