仓酷云

标题: MSSQL网站制作之利用MDX完成多维联系关系剖析 [打印本页]

作者: 莫相离 时间: 2015-1-16 22:38
标题: MSSQL网站制作之利用MDX完成多维联系关系剖析
对于insert和delete，event中包含了插入/删除的记录的所有字段的值(太爽了。。)
在经由了疾苦的数据堆栈与OLAP基本常识进修以后，在老板的声声敦促下，不寒而栗地创立了数据堆栈，计划了通用剖析型的OLAP剖析界面。

因而心中暗喜“哈哈，能够交差了。”，由于依照《需求仿单》里列出的功效项，均已完成。拿着这个产物离开客户方演示以后，客户连说

了几个“No”（怎样能如许呢，一点体面都不给？好歹我从一个数据堆栈的文盲到做出这个产物也消费了很多的工夫呀）。接上去，客户提出

了几个请求，要对数据举行智能剖析，详细的请求大概就像诸位已经履历或正在履历的一样吧。好吧，就让我尝尝往做智能剖析。
起首，我们来完成联系关系剖析。对了，我记得数据发掘道理中先容了联系关系剖析，经由一段工夫的苦读与实验，这个购物篮的例子仍是没有带给我

几启示？我用的是AS，内里只要两个数据发掘算法呀：决议树与聚类。我不太分明这两个算法与联系关系剖析怎样接洽在一同。接上去的几日，

我就在查找与浏览数据发掘及联系关系剖析中度过（有点华侈工夫吧，不外老板不肯意费钱请一个内行来做这个项目，没有举措，只要摸着石头过

河了）。是日，我疾苦得终究放下数据发掘方面的书本，从头翻开AS匡助文档，一边浏览着MDX部分，一边在便宜的MDX查询剖析器里做着实验

。俄然心血来潮，为何不尝尝用MDX来完成剖析呢？说干就干，一番实验上去以后，嘿嘿，还真乐成了。上面说是我的乐成步骤：
仍是先说说数据堆栈的布局吧：
SampleCube
--Dim1
----Dim1Hier1
------Dim1Lev1
------Dim1Lev2
------...
----Dim1Hier2
--Dim2
----Dim2Hier1
-------Dim2Lev1
-------Dim2Lev2
----Dim2Hier2
...
--measures
----Sum1
接上去，界说联系关系剖析中的撑持度--可托度目标；用MDX的with子句来完成
要完成Dim1.Dim1Lev1与Dim2.Dim2Lev1的联系关系剖析，界说以下：
with
member[measures].[Dim1Lev1Sup]as([Dim1].[Dim1Hier1].[Dim1Lev1].CurrentMember,[Dim2].[Dim2Hier1].[一切Dim2],

[Sum1])/([Dim1].[Dim1Hier1].[一切Dim1],[Dim2].[Dim2Hier1].[一切Dim2],[sum1])
member[measures].[Dim2Lev1Sup]as([Dim2].[Dim2Hier1].[Dim2Lev1].CurrentMember,[Dim1].[Dim1Hier1].[一切

Dim1],[Sum1])/([Dim2].[Dim2Hier1].[一切Dim2],[Dim1].[Dim1Hier1].[一切Dim1],[Sum1])
member[measures].[相信度]as([Dim1].[Dim1Hier1].[Dim1Lev1].CurrentMember,

[Dim2].[Dim2Hier1].[Dim2Lev1].CurrentMember,[Sum1])/([Dim1].[Dim1Hier1].[一切Dim1],[Dim2].[Dim2Hier1].[一切Dim2],[Sum1])
然后用select语句完成剖析，设Dim1Lev1Sup的最小撑持度为5%,Dim2Lev1Sup的最小撑持度为1%，完成强联系关系剖析（即相信度年夜于1).
select{[measures].[Sum1],[相信度],[measures].[Dim1Hier1Sup],[measures].[Dim2Hier1Sup]}oncolumns,

order(filter({[Dim1].[Dim1Hier1].[Dim1Lev1].Members*[Dim2].[Dim2Hier1].[Dim2Lev1].Members},[measures].[Dim1Lev1Sup]>0.05

and[measures].[Dim2Lev1Sup]>0.01and([相信度]/([measures].[Dim1Lev1Sup]*[measures].[Dim2Lev1Sup])>1)),[Sum1],bdesc)

onrowsfromSampleCube

如许强联系关系剖析算法就完成了。
以上为团体心得，若有更好的完成办法，请复兴告之。
Cluster/NDB高冗余的存储引擎，用多台数据机器联合提供服务以提高整体性能和安全性。适合数据量大，安全和性能要求高的应用

作者: 若相依 时间: 2015-1-19 20:06
从项目平台的选择上讲，我们关心的，应该是一款产品能不能满足任务需求，而不是网上怎么说。

作者: 分手快乐 时间: 2015-1-25 23:31
习惯敲命令行的朋友可能会爽一些。但是功能有限。适合机器跑不动SQLServerManagementStudio的朋友使用。

作者: 小女巫 时间: 2015-2-4 13:21
一个百万级别的基本信息表A，一个百万级别的详细记录表B，A中有个身份证id，B中也有身份id；先要找出A中在B的详细记录。

作者: 不帅 时间: 2015-3-9 21:37
然后最好有实践机会，能够把实践到的和实践结合起来，其实理论思考是个非常困扰和痛苦的事情

作者: 若天明 时间: 2015-3-17 01:25
这一点很好的加强了profiler的功能。但是提到profiler提醒大家注意一点。windows2003要安装sp1补丁才能启动profiler。否则点击没有反应。

作者: 透明 时间: 2015-3-23 14:59
在select语句中可以使用groupby子句将行划分成较小的组，然后，使用聚组函数返回每一个组的汇总信息，另外，可以使用having子句限制返回的结果集。

欢迎光临仓酷云 (http://ckuyun.com/)