从 concrete 的地方出发,更容易做成有用的东西。
2. 在 Maven "Philosophy" 网页上看到 silo effect http://en.wikipedia.org/wiki/Information_silo#Silo_effect
Wiki 不知道怎么又说到供应链管理,然后提到 Bullwhip effect http://en.wikipedia.org/wiki/Bullwhip_effect
3. 在 "silo effect" 的介绍中,又提到 ETL http://en.wikipedia.org/wiki/Extract,_Transform,_Load
这个正是 DataPotluck#6,Xiaohong 的演示文稿里用的词。
The typical real-life ETL cycle consists of the following execution steps:
- Cycle initiation
- Build reference data
- Extract (from sources)
- Validate
- Transform (clean, apply business rules, check for data integrity, create aggregates or disaggregates)
- Stage (load into staging tables, if used)
- Audit reports (for example, on compliance with business rules. Also, in case of failure, helps to diagnose/repair)
- Publish (to target tables)
- Archive
- Clean up
* 从工作的角度看,公司的流程既然如此相似,是不是利用了整个行业的特点?
* 从OpenGovernment的角度看,这些人做的有多少是无用功,怎么从 Data Integration http://en.wikipedia.org/wiki/Data_Integration 的角度想问题?
* 我自己的工作中,有多少设计是可以给外部用户提供一致的接口的?怎么做 Data Integration design?
* 为什么这些流程上的东西,会被研究得这么细致?一件事情,一种特征,出现那么多文章、那么多名词、示例来分析他。
* Maven 和 autotools 是什么关系? disclaimer: I know too few about either, or anything above.