• 北大核心期刊(《中文核心期刊要目总览》2017版)
  • 中国科技核心期刊(中国科技论文统计源期刊)
  • JST 日本科学技术振兴机构数据库(日)收录期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种基于矩阵和权重改进的Apriori算法

边根庆 王月

边根庆, 王月. 一种基于矩阵和权重改进的Apriori算法[J]. 微电子学与计算机, 2017, 34(1): 136-140.
引用本文: 边根庆, 王月. 一种基于矩阵和权重改进的Apriori算法[J]. 微电子学与计算机, 2017, 34(1): 136-140.
BIAN Gen-qing, WANG Yue. An Improved Apriori Algorithm Based Matrix and Weight[J]. Microelectronics & Computer, 2017, 34(1): 136-140.
Citation: BIAN Gen-qing, WANG Yue. An Improved Apriori Algorithm Based Matrix and Weight[J]. Microelectronics & Computer, 2017, 34(1): 136-140.

一种基于矩阵和权重改进的Apriori算法

基金项目: 

国家自然科学基金项目 61073196

国家自然科学基金项目 61272458

陕西省自然科学基础研究计划项目 2014JM2-6119

榆林科技计划项目 2014CXY-12

详细信息
    作者简介:

    边根庆   男, (1968-), 副教授.硕士生导师, 研究方向为信息管理技术

  • 中图分类号: TP31

An Improved Apriori Algorithm Based Matrix and Weight

  • 摘要:

    提出基于矩阵和权重的一种改进算法——MW_Apriori算法.该算法首先通过扫描一次事务数据库来构造0-1事务矩阵, 其次赋予项和事务权重, 并计算项的权重支持度, 从而得到频繁项集.实验结果表明, MW_Apriori算法避免了数据库的重复扫描, 使得时间和空间的耗费显著减少, 同时能有效地挖掘出隐藏的、更有价值的事件.

     

  • 图 1  MW-Apriori算法流程

    图 2  MW_Apriori与M_Apriori、Apriori算法运行时间对比

    表  1  事务数据

    Tid 事务
    100 A, C, D
    200 BCE
    300 A, B, C, D
    400 B E
    下载: 导出CSV

    表  2  项的权重

    Ij w(Ij)
    A 2.00
    B 1.33
    C 1.33
    D 4.00
    E 1.33
    下载: 导出CSV

    表  3  事务权重

    Tid wtTk
    100 2. 44
    200 1. 33
    300 1. 50
    400 1. 33
    下载: 导出CSV

    表  4  候选1-项集的权重

    C1 wsupport(S)
    A 0. 597
    B 0. 630
    C 0. 798
    D 0. 370
    E 0. 630
    下载: 导出CSV

    表  5  候选2-项集的权重

    C2 wsupport(S)
    AB 0. 227
    AC 0. 597
    AD 0. 370
    AE 0. 227
    BC 0. 429
    BD 0. 000
    BE 0. 630
    CD 0. 370
    CE 0. 429
    DE 0. 000
    下载: 导出CSV

    表  6  事务数据

    Tid 事务
    100 I1I2I5
    200 I2I4
    300 I2I3
    400 I1I2I4
    500 I1, I3
    600 I2I3
    700 I1I3
    800 I1I2I3I5
    900 I1I2I3
    下载: 导出CSV

    表  7  MW_Apriori与M_Apriori的1-项集支持度对比

    MM_Apriori算法 M-Apriori算法
    支持度 频繁项集 权重支持度 频繁项集
    I1 0.669 Y 0.667 Y
    I2 0.683 Y 0.778 Y
    I3 0.538 Y 0.667 Y
    I4 0. 310 Y 0.222 N
    I5 0.269 Y 0.222 N
    下载: 导出CSV

    表  8  MW_Apriori与M_Apriori的2-项集支持度对比

    MM_Apriori算法 M-Apriori算法
    支持度 频繁项集 权重支持度 频繁项集
    I1I2 0.494 Y 0.444 Y
    I1I3 0.386 Y 0.444 Y
    I1I4 0.142 N 0.111 N
    I1I5 0.269 Y 0.222 N
    I2I3 0.374 Y 0.444 Y
    I2I4 0. 310 Y 0.222 N
    I2I5 0.269 Y 0.222 N
    I3I4 0.000 N 0.000 N
    I3I5 0.128 N 0.111 N
    I4I5 0.000 N 0.000 N
    下载: 导出CSV
  • [1] Baralis E, Cagliero L, Cerquitelli T, et al. NEMICO: Mining Network Data through Cloud-Based Data Mining Techniques[C]//Utility and Cloud Computing, 2014IEEE/ACM 7th International Conference on. IEEE, 2014: 503-504.
    [2] Liao J, Zhao Y, Long S. MRPrePost-A parallel algorithm adapted for mining big data[C]//2014IEEE Workshop on Electronics, Computer and Applications. IEEE, 2014: 564-568.
    [3] Muhammad Asif, Jamil Ahmed. Analysis of Effectiveness of Apriori and Frequent Pattern Tree Algorithm in Software Engineering Data Mining[C]//proceedings of 2015 6th International Conference on Intelligent Systems, Modelling and Simulation. Shanghai, 2015: 28-33.
    [4] 郑麟. 一种直接生成频繁项集的分治Apriori算法[J]. 计算机应用与软件, 2014, 31(4): 297-301. doi: 10.3969/j.issn.1000-386x.2014.04.075
    [5] 付沙, 周航军. 关联规则挖掘Apriori算法的研究与改进[J]. 微电子学与计算机, 2013, 30(9): 110-114. https://www.cnki.com.cn/Article/CJFDTOTAL-WXYJ201309028.htm
    [6] 罗丹, 李陶深. 一种基于压缩矩阵的Apriori算法改进研究[J]. 计算机科学, 2013, 40(12): 75-80. doi: 10.3969/j.issn.1002-137X.2013.12.016
    [7] Zhang S, Du Z, Wang J T L. New techniques for mining frequent patterns in unordered trees. [J]. IEEE Transactions on Cybernetics, 2015, 45(6): 1113-1125. doi: 10.1109/TCYB.2014.2345579
    [8] Soltani A, Akbarzadeht M R. Confabulation-inspired association rule mining for rare and frequent itemsets[J]. IEEE Transactions on Neural Networks & amp; amp; Learning Systems, 2014, 25(11): 83-92.
    [9] 周发超, 王志坚, 叶枫, 等. 关联规则挖掘算法Apriori的研究改进[J]. 计算机科学与探索, 2015, 9(9): 1075-1083. https://www.cnki.com.cn/Article/CJFDTOTAL-KXTS201509006.htm
    [10] 吴学雁, 莫赞. 基于Aproiri算法的频繁项集挖掘优化方法[J]. 计算机应用, 2014(6): 124-129. https://www.cnki.com.cn/Article/CJFDTOTAL-XTYY201406022.htm
  • 加载中
图(2) / 表(8)
计量
  • 文章访问数:  181
  • HTML全文浏览量:  51
  • PDF下载量:  3
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-04-01
  • 修回日期:  2016-05-18

目录

    /

    返回文章
    返回