ETL反饰特:跳过文件

文档是一种资产,既讨厌和被爱。创建技术和商业文档通常被视为乏味的苦难,真正应为每个项目做的事情,但通常是一个轻松的候选人,直到以后(或完全跳过)。

另一方面,良好的文件–特别是围绕数据移动和ETL过程–与它描述的过程一样有价值。一个清晰和最新的文档,描述了ETL工作流程的何时,何地和原因增加了透明度,并使该过程更容易理解那些支持它的人。

Etl.反饰特:跳过文件

I’LL承认,文件的工作比实际建立你的东西更令人愉快’重新记录。创建文档是一个非常喜欢在一个非常有趣的派对之后在清理机组人员工作:没有人真的想做,但它需要完成,并正常完成。

但良好的文档对于任何技术项目至关重要’对于ETL项目尤其如此。在提取 - 转换加载过程中处理的方式对向该数据的消费者提供的信息产生巨大影响。一个不透明或不正确的处理数据的ETL过程将仅贬值所产生的输出。

好文件是什么样的?

简而言之,良好的文档与预期的观众发言。对于技术受众,包括元数据规范,安全性和身份验证等主题,以及详细的错误处理。半或非技术业务用户将对任何计算值的摘要更感兴趣,以及在处理期间应用的业务规则的简要叙述。这两个受众都将有兴趣的是使用哪些数据来源,处理的任何包含或排除规则以及负载过程运行的节奏。

It’对于技术用户和商业用户来说,共同点是具有单独的文档。虽然这需要一些额外的努力,但两个受众都将受益于有良好的文件,这些文件将解决每个小组可能拥有的问题。

创建好的ETL进程文档需要时间和精力,但它的价值不能夸大。大学教师’T获取略微的浏览数据移动和转换任务的必要步骤。

关于作者

Tim Mitchell
Tim Mitchell is a 数据架构师和顾问 谁专注于摆脱数据疼痛点。 需要帮助数据仓库,ETL,报告或 训练?如果是这样的话, 联系Tim. 没有义务30分钟聊天。

发表评论

本网站使用AkisMet减少垃圾邮件。 了解如何处理评论数据.