|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
对于insert和delete,event中包含了插入/删除的记录的所有字段的值(太爽了。。)
在经由了疾苦的数据堆栈与OLAP基本常识进修以后,在老板的声声敦促下,不寒而栗地创立了数据堆栈,计划了通用剖析型的OLAP剖析界面。
因而心中暗喜“哈哈,能够交差了。”,由于依照《需求仿单》里列出的功效项,均已完成。拿着这个产物离开客户方演示以后,客户连说
了几个“No”(怎样能如许呢,一点体面都不给?好歹我从一个数据堆栈的文盲到做出这个产物也消费了很多的工夫呀)。接上去,客户提出
了几个请求,要对数据举行智能剖析,详细的请求大概就像诸位已经履历或正在履历的一样吧。好吧,就让我尝尝往做智能剖析。
起首,我们来完成联系关系剖析。对了,我记得数据发掘道理中先容了联系关系剖析,经由一段工夫的苦读与实验,这个购物篮的例子仍是没有带给我
几启示?我用的是AS,内里只要两个数据发掘算法呀:决议树与聚类。我不太分明这两个算法与联系关系剖析怎样接洽在一同。接上去的几日,
我就在查找与浏览数据发掘及联系关系剖析中度过(有点华侈工夫吧,不外老板不肯意费钱请一个内行来做这个项目,没有举措,只要摸着石头过
河了)。是日,我疾苦得终究放下数据发掘方面的书本,从头翻开AS匡助文档,一边浏览着MDX部分,一边在便宜的MDX查询剖析器里做着实验
。俄然心血来潮,为何不尝尝用MDX来完成剖析呢?说干就干,一番实验上去以后,嘿嘿,还真乐成了。上面说是我的乐成步骤:
仍是先说说数据堆栈的布局吧:
SampleCube
--Dim1
----Dim1Hier1
------Dim1Lev1
------Dim1Lev2
------...
----Dim1Hier2
--Dim2
----Dim2Hier1
-------Dim2Lev1
-------Dim2Lev2
----Dim2Hier2
...
--measures
----Sum1
接上去,界说联系关系剖析中的撑持度--可托度目标;用MDX的with子句来完成
要完成Dim1.Dim1Lev1与Dim2.Dim2Lev1的联系关系剖析,界说以下:
with
member[measures].[Dim1Lev1Sup]as([Dim1].[Dim1Hier1].[Dim1Lev1].CurrentMember,[Dim2].[Dim2Hier1].[一切Dim2],
[Sum1])/([Dim1].[Dim1Hier1].[一切Dim1],[Dim2].[Dim2Hier1].[一切Dim2],[sum1])
member[measures].[Dim2Lev1Sup]as([Dim2].[Dim2Hier1].[Dim2Lev1].CurrentMember,[Dim1].[Dim1Hier1].[一切
Dim1],[Sum1])/([Dim2].[Dim2Hier1].[一切Dim2],[Dim1].[Dim1Hier1].[一切Dim1],[Sum1])
member[measures].[相信度]as([Dim1].[Dim1Hier1].[Dim1Lev1].CurrentMember,
[Dim2].[Dim2Hier1].[Dim2Lev1].CurrentMember,[Sum1])/([Dim1].[Dim1Hier1].[一切Dim1],[Dim2].[Dim2Hier1].[一切Dim2],[Sum1])
然后用select语句完成剖析,设Dim1Lev1Sup的最小撑持度为5%,Dim2Lev1Sup的最小撑持度为1%,完成强联系关系剖析(即相信度年夜于1).
select{[measures].[Sum1],[相信度],[measures].[Dim1Hier1Sup],[measures].[Dim2Hier1Sup]}oncolumns,
order(filter({[Dim1].[Dim1Hier1].[Dim1Lev1].Members*[Dim2].[Dim2Hier1].[Dim2Lev1].Members},[measures].[Dim1Lev1Sup]>0.05
and[measures].[Dim2Lev1Sup]>0.01and([相信度]/([measures].[Dim1Lev1Sup]*[measures].[Dim2Lev1Sup])>1)),[Sum1],bdesc)
onrowsfromSampleCube
如许强联系关系剖析算法就完成了。
以上为团体心得,若有更好的完成办法,请复兴告之。
Cluster/NDB高冗余的存储引擎,用多台数据机器联合提供服务以提高整体性能和安全性。适合数据量大,安全和性能要求高的应用 |
|