A1:笑得海潮 B3:冒泡的崔 D2:Cornell University,Computer Vision Group H2:冰河的博客 G3:丕子博客 K1:MLA CHINA K4:斯坦福视觉实验室 L4:MIT 机器学习实验室
现在位置 >首页 > 所有关于Apriori的文章
cat_ico23 category cat_ico37 category
发表于573 天前 技术, 科研 评论数 8 ⁄ 被围观 991 次+
关于关联规则挖掘Apriori算法的优化方法
Apriori算法虽然好用,但是当数据量十分庞大的时候,效率是相当低下的,由于我的计算任务十分紧张,所以想有什么方法可以优化一下效率问题么?我也简单思考了一下,大体想出如下方法。 1、在进行Lk∞Lk联结运算的时候,这个嵌套两层循环的优化是一个十分重要的方面,频繁项集咱们按顺序排序之后,就可以这么来写: for i=1:k-1 for j=(i+1):k %省略代码 end end 这样一来,每次循环的速度会变得越来越快。 2、就是判断支持度的问题,按算法的顺序来说,应该是先进行计算候选集C,然后在计算候选集C的每个规则支持...
阅读全文
cat_ico23 category cat_ico37 category
发表于575 天前 技术, 科研 评论数 1 ⁄ 被围观 2,202 次+
关联规则挖掘-Apriori算法笔记
这两天的实验用到Apriori算法,记不清是怎么计算候选集的了,搜索资料想起来是通过“联结”来计算的,例如{2,3}{3,4} 右左都有3,所以做连接形成{2,3,4}。 但是如果{2,3,4}支持度大于阈值就行了么?如果不能推出{2,4}怎么办?要把{2,3,4}计算子集再看么?这样岂不是太麻烦,还是“联结”操作已经解决了这个问题? 其实在程序中还是要求子集看看是否子集是频繁项集里面的。 关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market basket analysis)。例如,购买鞋的顾客,有10%的可能也会买袜...
阅读全文

无觅相关文章插件,快速提升流量

不想听你唠叨×