|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
通过支付一定费用,客户可以得到优先的24/7支持,访问内容丰富的在线知识库和联系一个专门的技术负责经理。观点|数据1.甚么是数据堆栈
在W.H.Inmon所著"BuildingtheDataWarehouse"一书中给出了数据堆栈的界说:"数据堆栈是面向主题的、整合的、不乱的,而且时变的搜集数据以撑持办理决议的一种数据布局情势。",说的普通一点:数据堆栈手艺也就是俗称的散布式数据库加上一种制约前提,而构成的新的数据存储和处置办法。
而这个制约的划定规矩正式本书会商的重点。
2.从数据库à数据堆栈的变化
为何在有了这么多半据库产物以后,人们又要用数据堆栈手艺。业界的各路诸侯又云云趋附者众。这恰是盘算机手艺使用需求的推进。昔时数据库手艺年夜开展的历程是陪伴着OLTP(OnLineTransactionProcess联机营业处置)使用需求的推进。联机营业处置最急切的手艺请求就是疾速呼应。数据库手艺,出格是基于E.F.Codd提出的干系实际的数据库的手艺,将数据集分红了甚少冗余的实体(Entity),然后又将它们按必定的干系(Relationship)编织成一个无机的全体,对照完善地满意了OLTP的使用需求。关于每一个营业处置最好只须触及一个实体,营业处置关于实体的Add或Update也只触及数据媒体的大概最小的空间(如纪录级封闭手艺),关于别的实体的相干更新经由过程干系坚持了分歧性和完全性。这个符合事先OLTP使用实践需求的实际和手艺的乐成,推进了干系数据库产物风行天下。呵呵,是否是看得不太分明,不妨,多看几遍就分明了,这个寄义是指:将数据按目标、利用频次分类存储,分歧的使用会见分歧的数据类,还不分明?你太笨了吧!
3.数据堆栈是散布式体系中的主要一环
这是一个典范的散布式数据库计划图:
操纵型数据
应当注重到,数据堆栈并非散布式体系,它是个中的一部分,但假如分明了数据堆栈在个中的位置,那末也就晓得了为何叫数据堆栈,而不叫散布式使用体系了。缘故原由很复杂,数据堆栈是中心,别的的部分都要以它为圆心,终极的了局,便构成了一个相似太阳系的布局。
操纵型数据是我们从林林总总的数据源中拿到的林林总总的数据,这是全部体系数据的最原始的形态,从中看到我11月11日打德律风的记录,也能够看到我在15日有甚么账单,这个账单的详细内容,乃至还能够看到飞机的腾飞和抵达工夫,假如你分明了这内里放了些甚么,那你也就应当能看懂上面的器材。
操纵型数据的特性:
1.及时性:数据几近都是以后值。
2.数据源极为丰厚,各类来自企业内部和外部发生的数据。
3.对反响工夫的请求很高。(你总不克不及为了增加一条账单纪录等上1个小时吧)
以是由此也能够看出,就算是让我计划一个操纵型数据库,也不是很难,:-)提早说一句,操纵型数据的计划遵守:需求à系统布局à完成代码à装进数据。
数据堆栈最年夜特性就是一个“稳”字,先不说它是怎样从操纵型数据中提取数据的,单说一说他的数据更新周期起码24小时,你就应当分明;用它的数据是不成能做一个及时性强的器材的,没错,它存在的目标不是让你往做甚么有及时性的器材,它是为了让你可以使用从操纵型数据库提取的数据作剖析和统计事情。晓得了么?这一点是很主要的。这也是每个作DSS(之前称之为MIS)的剖析员的追主要的事情,要不怎样叫决议剖析体系呢:P
想晓得他的优点仍是听一听专家的定见吧:间接利用联机营业处置体系中的数据举行决议撑持数据的剖析处置是会发生很多贫苦的,乃至是完成不了的。这时候候,人们就会问为何体系中有我必要的数据,而我却没法使用呢!这不是说干系数据库欠好,而是老产物碰到了新义务。E-R型的数据布局能完善地实行联机营业处置,但不顺应较年夜范围的决议撑持数据剖析,特别不顺应企业级的决议撑持数据剖析处置的必要。顺应这一需求,应运而生的就是数据堆栈手艺。
数据堆栈的方针是为了制订办理的决议供应撑持信息,这明显的与OLTP(联机事件处置)体系的疾速呼应必要分歧。正象企业为了开展要举行营业重组一样,为了撑持办理决议必要也要按决议营业科目标请求重组OLTP体系中的数据,并要按分歧决议,剖析内容分离构造使之便利利用。这类基于主题的形式从用户角度来看就是多重的数据重组布局。
在把数据装载到数据布局重组后的数据堆栈之前,先要举行数据转换,或称"整合"处置。这一处置包含几个必不成少的操纵步骤,做到使数据完全、一致,这就确保了在利用数据堆栈时个中的数据是有质量包管的,对今后文有胪陈。简而言之,整合就是包管数据正确,到位,没有超越应有的数值局限,没有反复等。
OK!听分明了么?有点庞大么?没关系,记着一点就好了:数据堆栈就是为了给统计剖析等事情,专门计划的数据撑持,就这么复杂,总结一下:
数据堆栈:
1.数据无及时性,更新工夫较长。
2.数据来历是操纵型数据,经由必定形式的抽取。
3.在处置的时分,对事务请求对照宽松。
它的计划但是绝对庞大的,但能够一定的是:数据堆栈是依照:数据―〉需求。这也能够了解:巧妇难为无米之炊。你筹办了一年夜堆萝卜可不也就只能作一道“萝卜闭会”么!以是,DSS计划的主旨是:你把我必要的给我,我再告知你我想要的。听起来是否是挺别扭的。:)
到今朝为止,你应当已对数据堆栈有了一个周全而深刻的熟悉了,呵呵,下一步就应当是细心的研究一下巨大的BuildingtheDataWarehouse啦。
马磊Wednesday,November29,2000
客户还是可以使用DBaaS系统所能提供的所有能力。数据库云服务消除了组织对专职人员、本地数据库存储设备的需要。他们不必安装、配置和维护任何软硬件。 |
|