基于群体智能的关联规则挖掘及应用

发布时间 : 星期五 文章基于群体智能的关联规则挖掘及应用更新完毕开始阅读

山东师范大学硕士学位论文

理论停止时间和实际停止时间,如表3所示。表3中还显示了算法的效率,笔者选择了候选规则中最后淘汰的规则个数和没有进入计算的规则个数,用于刻画算法的效率。

表3 理论停止时间和实际停止时间比较

停止时间 理论停止时间 实际停止时间 0.03 0.1 0.03 BSAR 15008 2401 _____ ASAR 7393 1638 5383 ApASAR 7967 1734 3875 PSASAR 7024 1760 3351 由表2和表3以及前面的分析中,可以得到PSASAR算法与前三种抽样相比较所具有的几个特点:

一次性抽样算法的理论样本量比ASAR和ApASAR都大,这是因为一次性抽样样本量的计算采用的是一致的估计精度,而序贯抽样算法采用的是不断变小的精度,从而导致样本量的需要是逐渐增加的,而增加到可以允许的精度范围内,可以提前停止算法,从而节省了总的样本量。PSASAR算法在序贯抽样算法的基础上增加了智能搜索,不满足适应度值的规则当即被淘汰,而在理论停止时间上,ASAR、ApASAR算法对样本量的要求稍低于PSASAR。 从实际的停止时间来看,PSASAR比ApASAR和ASAR的停止时间要短的多,但是PSASAR的停止时间大约占理论停止时间的1/3左右,而其他两种算法的实际停止时间占理论时间的比例大约1/2、1/3左右,这说明对PSASAR的算法的执行效率应该进行更深层次的挖掘。

通过以上实验,我们可以得到如下结论,PSASAR无论在实际停止时间上,还是在算法的规则空间占有上,都显示出PSASAR比ASAR、APASAR、BSAR 算法具有较强的优势,而PSASAR则在内存空间的节省方面又迈出了重要的一步。

49

联系合同范文客服:xxxxx#qq.com(#替换为@)