|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
想法是和程序员的想法不一样的.至于为什么.大家去想一想.跟心理学有关的办理|数据Sybase软件(北京)无限公司市场部副总监夏红
内容:数据堆栈观点,Sybase的数据堆栈办理计划
--------------------------------------------------------------------------------
数据堆栈的观点
任何一个公司和企业,在定货、存货清单、单子清单、帐目整理、客户服务和
财政呈报等方面都存在大批的营业使用和手艺环节。数据堆栈的感化在于:从这
些使用体系中猎取信息并转换到一个新的数据库,经由过程对新库中的汗青信息和面
向主题的信息举行剖析,为决议供应撑持。以往的产物体系,如定货或置办体系,
则很难从中取得有关贸易开展情况的信息。
数据堆栈是企业决议撑持的一部分。在做出下一个决意前,每一个贸易机构中的行
政职员和剖析职员都必要将很多关头贸易成绩弄分明,比方:哪些产物最有益可
图?哪些客户会为我们带来最年夜好处?哪些环节必要消费很高的用度?哪些市场举动
运转得最好,为何?我们有大概会得到哪些客户,为何?
这些都是数据堆栈要
回覆的“百万利润”成绩,也同时是一个最年夜的市场。据Gartner估量,60%
的关
系数据库办理体系被用作决议撑持体系的使用开辟。
数据堆栈与数据集市的对照
在二十世纪八十年月中期,BillInmon初次提出“数据堆栈”这一位词。它最后被
计划为一个贸易数据库,具有不乱性(次要成份稳定)、汗青性(包括汗青信息)和面
向主题(信息由客户、产物和市场等构成)等特性。这些最后的“数据堆栈”依据
对客户、产物、发卖情形和财政情况等信息的剖析,失掉对企业举动的全体熟悉。
要创建一个数据堆栈,一样平常分为四个步骤:
第一步:数据库计划,即计划出一个包括贸易数据和信息的数据库,为贸易实体
所用;
第二步:开辟数据抽取和转换程序,从产物体系中将数据掏出后放进数据堆栈中;
第三步:开辟数据加载和更新手艺,使得在产物数据产生变更时,数据堆栈失掉
静态及时的更新;
第四步:置办查询和报表天生工具,令利用者经由过程企业外部网和团体盘算机很方
便地猎取信息。
多年以来客户发明:只管企业级数据堆栈很有吸引力,可是详细操纵起来有些难
度。1996年“IDC研讨”查询拜访了局标明:只管为创建数据堆栈均匀投进了三年多
工夫和近320万美圆,50%没有到达应有的效果。从项目入手下手算起,三年后,年夜多
数贩子发明所面对的贸易成绩已不再是入手下手创建时的模样,产生了很年夜变更。
别的,只管开辟进度被延伸了一年又一年,仍旧做不到让一切感乐趣的客户对想
看到甚么信息给出明白的需求界说。因此“企业数据模子”切实其实立好像实习一样
举行了一年又一年。
在比来的18-24个月的工夫里,呈现了一种新的办理举措,那就是数据集市。数据
集市也是一种数据堆栈,只是它更简练,更面向主题。Sybase公司自创建以来,
便建立了在数据集市手艺上的向导位置。今朝,利用Sybase产物的2万多家客户中
的年夜多半已创建了运转在SQLServer上的数据集市,只管一般也称为数据堆栈,
却几近没有一个是企业级的。
数据集市的上风在于建立周期的延长和用度上的年夜年夜下降。个中周期以月取代了年,
用度从几百万下落到一百万。因为全部企业的数据很复杂,真正将它们会合到一个
数据库中几近是不成能的。有人便对良多年夜数据堆栈本色上是否是数据集市发生了
嫌疑。利用数据集市后。计划、抽取、转换、加载和查询等环节变得加倍复杂,因
为客户中的一部分人可以更准确地晓得他们本人所必要的信息是甚么。
但是,假如有良多的数据集市却不克不及使它们坚持同步,数据集市办理计划就会碰到
坚苦。一旦一个单元创立了两个或两个以上的数据集市,最年夜的成绩就是怎样使它
们之间和谐分歧,怎样使它们及时操纵,和怎样保护一切的数据抽取和转换。另
外,当一个单元要创立两个或两个以上的数据集市时,会发明每个都要经由一个
从头的计划、抽取、加载和查询步骤。因而,在面临多个数据集市的开辟时,怎样
共享计划和布局成为一个有实际意义和应战性的成绩。
运作型数据存储与兼并式数据堆栈
针对上述成绩,一种办理计划是接纳一种全新的数据堆栈观点---“运作型数据存
储(OperationalDataStore,ODS)”。在ODS体例下,数据被从营业数据库中复制到
一其中心地位,再从这里被抽取到多个数据集市中。ODS是从客户、产物和其他商
业角度来构造的,被称为贸易情况的“及时快照”。它不包括汗青信息,但能够很
简单地满意一个汗青数据库或一组面向主题的数据集市的必要。
我们一样平常称之为“兼并式数据堆栈”,由于它在进进决议撑持数据库之前是一个信
息的分离点。ODS虽小,却能被常常地修正,因此十分合适于创建在Adaptive
Server
Enterprise和ReplicationServer上。
多维或OLAP(联机剖析处置)市场
作为数据堆栈使用环节中的一部分,在市场份额上失掉疾速增加,变得愈来愈年夜。
复杂来讲,OLAP是从贸易角度举行信息构造,而不象一般的由行、列和表组成。
比方,在一个相似Arbor或OracleExpress的OLAP数据中,信息是经由过程客户、产
品、日期、发卖部门和地区等属性来存取的,这关于数据了解和信息猎取来讲都
显得十分直不雅。
OLAP产物获得干系数据后,将它放进一个十分复杂的表格中,使之很简单剖析。
数据库和一个OLAP产物可被看作一个多维表格。这个市场相称抢手,Arbor、
Oracle的Express和Microstrategy在此范畴中各占一席之地,而Sybase的
Power
Dimentions(原名whitelight),Cognos的Impromptu和Powerplay,BrioTechnology的
BrioQuery处于上风位置。
合作敌手与互助同伴一览
RDBMS公司:Sybase,Oracle,IBM,Teradata/NCR,Informix,Microsoft
硬件公司:IBM,Teradata,Sun,Digital/Compaq,HP
转换工具:VMARK,Infomatica,Carleton/Apertus,ETZ,PrismSolutions
OLAP:Sybase/PowerDimentions,Arbor,Oracle/Express,Microstrategy,
InformationAdvantage。
Sybase的办理计划及其构成
Sybase具有一个共同而强无力的点对点计划,用来计划、创建和办理数据堆栈和数
据集市。各个部门之间经由过程会合的元数据举行交互,这便具有了完全性、会合性和
天真性等特性。我们的工具也具有良多优胜功能。
下表列出了各个构成部分:
(1)PowerDesignerWarehouseArchitect
PowerDesigner不仅是业界出名的数据库计划工具,也是数据堆栈模子计划工具。其
中的WarehouseArchitect模块撑持多种数据堆栈模子,包含星型形式、雪花形式、以
及雪暴形式。这是偕行业中最优异、最天真的开辟工具,可用来计划一个干系的或
OLAP的软件堆栈。PowerDesigner在数据堆栈计划工具市场中占据最年夜份额。它能从
已有的数据库举行反向工程,从运转体系中将现存的数据布局抽掏出来构成数据模
型,使计划变得复杂。
(2)PowerStage
壮大的数据抽取和数据转换产物。它是向导市场的客户/服务器转换办法,使数据仓
库模子用PowerDesigner完成起来加倍简单,加倍直不雅。PowerStage真恰是平安并基于
引擎的。它有一个复杂的面向处置的图形用户接口,使得用户能够疾速启动,反复
使用以往的</p>SQLServer是基于服务器端的中型的数据库,可以适合大容量数据的应用,在功能上管理上也要比Access要强得多。在处理海量数据的效率,后台开发的灵活性,可扩展性等方面强大。 |
|