数据质量

Bad Data Can Kill

坏数据可以杀死。字面上地。我不是在谈论错误数据对业务底部的影响,估计总损失的估计通常在每年数十亿美元中衡量。我也没有谈论我们所有面临的不便,当呈现出不正确或陈旧的数据产生的真实情况时。这…


We Don’t Trust This Data

“学会信任是生活中最困难的任务之一。”–ISAAC WATTS作为数据专业人士,有时候我们的工作相对容易。备份数据库。创建仪表板报告。将数据从扁平文件移动到数据库。创建文档。这些机器中有很多齿轮,但经验丰富的技术学家将遇到困难…


null,空字符串或零?

答案:它取决于。我在管理数据质量时遇到的更常见问题之一,尤其是在ETL进程中,是正确处理空,空字符串或零值。当我穿上我的讲鞋谈论坏数据时,这是我要花费大量时间覆盖的领域,因为它…


修复SSI中的不一致行终端

使用SQL Server集成服务处理数据文件时,在文件中每行的每个行找到具有不同行列标记的文件并不罕见。在此帖子中,我将演示如何在SSI中修复不一致的行终端符,以避免ETL错误。在每个文本文件中修复在SSI中的不一致行终端终端,还有一个名为行的不可打印字符…


如何在煎炸火鸡时烧掉你的房子

这是一个奇怪的查询,是的,但准备写这篇文章我实际上在我的浏览器中键入上面的短语。不,我肯定不会想烧我的房子。事实上,在我清除搜索历史的同时在这里,以防万一。为了论述,假设你计划在即将到来的情况下炸土耳其…


Mile High Tech Con

在科罗拉多州丹佛下个月发布了一个全新的商业智能会议。 Mile High Tech Con是2014年7月24日至26日举行的为期三天的活动,并针对商业智能从业者,数据分析师和信息经理/ CIO。来自活动网站:专注于数据仓库和商业智能的三天的课程和活动。英里高科技…


即将到来的SQL星期六前列

我很乐意宣布今年夏天在三个不同的SQL星期六活动之前提供三天的一天的预发研讨会:爱荷华州爱荷华州–7月26日星期五(在SQL星期六239之前–东爱荷华州奥兰多,佛罗里达州 - 周五,9月13日(在SQL星期六232年232年)丹佛,科罗拉多州 - 9月27日(在SQL星期六190 - 丹佛之前)…


2013年通过峰会

我很乐意宣布,我已被选为10月北卡罗来纳州夏洛特的SQL传递峰会。  我将在题为“SQL Server集成服务中的数据清理的数据清理”的会话,其中我将介绍各种方法来使用内置(或可访问)SQL Server集成服务的工具来检测和清除脏数据。这会…


DQS综合域和价值组合

由于我在过去几周内与数据质量服务一起使用,我花了很多时间使用数据域,综合域和规则。在该探索中,我发现了一些在对包含复合域的知识库执行清洁操作时可能无法预期的行为。在这篇文章中,我将概述预期的数据清洁…


综合域上的DQS验证规则

在数据质量服务中,可以创建复合域以将两个或多个自然域在知识库中关联。与自然域一样,复合域也可以包含一个或多个验证规则,以控制哪个域值有效。在我的最后一篇文章中,我讨论了对自然域的验证规则的使用。在这篇文章中,我会继续…