简介:简介由于拼写错误、意外的缩略语和其他不规则问题,实际的数据是“有问题”的。因此,在数据仓储项目中,很大一部分的时间和金钱都花费在了数据提取、数据转换和数据加载(ETL,Extraction、Transformation、Loading)阶段。在ETL阶段,新数据被清理、标准化,并使其与现有数据一致。在MicrosoftSQLServer2005中可用的模糊查找和模糊分组转换,有助于使ETL过程在遇到若干种在交际数据中观测到的常见错误时更易复原。它们解决一般的匹配和分组问题,而无需特定于域的规则和脚本的专家集合。通过为您的域自定义模糊查找和模糊分组,您可以利用BusinessIntelligenceDevelopmentStudio内的通用数据清理算法,并避免创建复杂的自定义规则和代码。
简介:当你的SQLServer数据库系统运行缓慢的时候,你或许多多少少知道可以使用SQLServerProfiler(中文叫SQL事件探查器)工具来进行跟踪和分析。是的,Profiler可以用来捕获发送到SQLServer的所有语句以及语句的执行性能相关数据(如语句的read/writes页面数目,CPU的使用量,以及语句的duration等)以供以后分析。但本文并不介绍如何使用Profiler工具,而是将介绍如何使用read80trace(有关该工具见后面介绍)工具结合自定义的存储过程来提纲挈领地分析Profiler捕获的Trace文件,