SAP培训:httpwww51sapc
数据建模分析
1建立模型前应该想到的问题。
11数据仓库的数据组织是面向主题的,而不是报表。
操作型数据库的数据组织结构面向事物处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题进行组织的。主题是一个抽象的概念,是指用户使用的数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
这和软件编程中的面向对象的概念类似,在项目中要面向一个功能模块的实现,不是面向一个方法的实现。在我们建模中,也是面向一个分析点的方面。
可以参照以下主题,来判断如何划分主题:!顾客的购买行为!产品销售情况!企业生产事物!原料采购!合作伙伴关系!会计科目余额
但是现在的数据仓库实施中,很多数据仓库需求都是来自业务部门的出具的报表的需求,这样数据仓库的数据模型结构往往来源于报表的数据需求。基于报表的需求要比没有明确的需求要好,所以现在大多数业务部门更多的是采用报表的需求方式来进行开发的,这样需求方和实施方都会拥有一个比较明确的界限和口径。
但是面向报表的开发不是最好的,而且有很多缺点。所以我们正确的做法是,要对现有的报表需求进行细致的分类,分析和调整,不能为了实现单个报表而进行大量的建模工作。要根据分析的不同内容和主题对报表进行分类,明确报表中每个数据的定义,统计口径及不同数据之间的关系,建立在
fSAP培训:httpwww51sapc
整个数据仓库内统一的数据指标定义,将数据指标按分析主题及分析维度进行归集,从而形成面向主题的数据类型。
例如:我们的利润表报表,当业务部门发我们一个利润表的报表,作为需求时,我们应该进行细致的分析,最终我们确定我们面向的主题不是利润表,而是比利润表更大的一个层次的所有科目业务量的主题,这样我们在做别的报表,例如资产负债表,现金流量表等报表时,就不用重复建模的工作了,做到了软件工程中的可重用规则。12数据仓库要实现对数据的集成与数据的同构性。
面向事物处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取,清理的基础上经过系统加工,汇总和整理得到的,必须消除源数据的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
例如:在总公司和分公司之间,某个部门id或公司id名字不一样,不是同构的,比如一个人家人叫他张三别人叫他小张,这种情况在r