?

Log in

No account? Create an account

December 14th, 2012

fedora 蓝色小药丸

DataPotluck #6

First time was in October, DataPotluck #4

This time (#6) it was again about open government, and data usage. Many people are from government agency, and they all say "with a different politician leadership many things are becoming possible... the government data is more open, more transparent, easier to reach", and urge the community and not-for-profit groups to use them. "after all, data not used are gone, which is a kind of waste..."

open government 的想法真是“有理想”,而且确实数据量巨大。演讲的人是 CMAP[1] 的 Greg 和 Xiaohong,她说因为这些数据都属于纳税人,所以政府是有义务公开、为纳税人所用的。她的工作流程是“导入、转换、发布”。这听起来和 Morningstar 的某些工作又很类似。上次(#4)就感到 tribune crime app 的流程是相似的。区别在于,那个 app 是“下游”,而 CMAP 则是“上游”。

另外一位叫做 Derek Eder 的青年非常活跃。他说到政府有三个主要的 data hub[2],加上 CMAP 是第四个。 CMAP 的做法是综合其他三家,也会发布一些原创的数据。我感觉 CMAP 将数据按照地理位置来加总的做法很有趣。实际上,两次活动,参与的人主要都是 GIS 专业的,其他的有 designer, 数学、程序员、教育服务等等,但是都不如 GIS 这样和政府的数据直接相关。地理范围有几个级别,Chicago 之外的人也许会很迷惑。比如 Cook County 会跨越很大的范围,包括 city 和 suburb city,这些 city 又称为 municipality;然后 city of Chicago 又划分成 77 个 community area (CCA);至于 “Census Tract” 和 “Census Block” 就不知道是什么了 (三五个 block 凑成一个 block group (BG),三五个 BG 凑成一个 tract,整个 city of Chicago 有 866 tracts,超过 10000 groups。)

政府开放数据是一个长期的过程,就连部门内部交换数据都很难,开放数据可以促进内部的流程优化,所以是个好事情。但是即使在 Chicago,他们都说是几个城市里做得比较好的,“走在前面”,那也需要领导人和财政的支持,这两年才活跃起来。如果不是从“纳税人”的角度想事情,真的会觉得他们是因为没有事情做,才设立许多虚职,做些没有用处的东西。

Metro 是 metropolitan 的意思,不是 metra。我真的是打酱油的——事前犹豫了很久要不要去看看。因为觉得这些人都很聪明,跟这些人打交道,自己也许能变得聪明些。不过,不用心,不思考,那怎么也不会。我比较关心的是有哪些东西是可以被其他城市借鉴的。如果一个城市要从无到有,建立 open government 这帮人理想中的系统,应该做什么?

* 政府支持,比如每个部门要设立 open data ambassador/coordinator
* 部门 data exchange API 与 public data API
* 定义 data set,每个部门都有自己的 data point
* 定义 GIS 范围
* 关于“导入,转换,发布”,实际上还有“通知”,也是协议的一部分。只看 pipeline 已经建立起来的情形,那么就省掉了“通知”。怎么让中间的转换不丢信息,或者可以携带更多信息?怎么减少中间转换步骤?
* 不同的阶段(比如社会主义初级阶段,纳税人...),不同的条件,具体的人员、部门设置,服务器配置,代码。
* 应用范例。主要还是社会服务、教育服务?


[1] CMAP 网站 http://www.cmap.illinois.gov/ (特别是 2040 planning)
http://metropulsechicago.org 数据介绍?各种 indicators
http://data.cmap.illinois.gov/APIHome.html RESTful API

[2] 三个主要的 data hub
http://data.cityofchicago.org/catalog.rss?type=created city of Chicago
https://datacatalog.cookcountyil.gov/catalog.rss?type=created Cook County
https://data.illinois.gov/catalog.rss?type=created Illinois
https://www.metrochicagodata.org/catalog.rss?type=created CMAP
https://twitter.com/opendatachicago 新数据点,用 yahoo pipes 集成 RSS,然后再转发到 twitter feed,from Derek


edit: 自己第一次来 Chicago,买的最贵的一本书就是 “Open Government” from O'Reilly,但是一直都没有看。本来以为是关于政府采用开源软件之类,可是想来应该是关于上面说的那些。这本书是 2010 年初的,现在 Big Data, GIS, data visualization 流行,它也该有新版了。
Tags:
fedora 蓝色小药丸

Easy reading "Code Simplicity" from O'Reilly

http://www.codesimplicity.com/
http://shop.oreilly.com/product/0636920022251.do
By 

做程序员的一定要时不时地读一些 easy reading,尤其是不需要做算法、操作系统那些高深东西的,多出来的脑细胞应该想办法用掉。而且 easy reading 可以让工作更顺利些。
Read more...Collapse )