当前位置: 首页 > 工具软件 > SPMF > 使用案例 >

top-k 高效用项集挖掘_学习笔记 (一)基本算法和SPMF数据库

平山
2023-12-01

近年来提出了几种高效用项集挖掘算法。开源数据挖掘库SPMF中提供了目前Java实现的最先进的算法。(http://www.philippe-fournier-viger.com/spmf/)

例如,它提供了Two-Phase算法(2005年)、 UPGrowth算法(2011年)、 HUI-Miner算法(2012年) 和
FHM算法(2014年)的源代码。(http://www.philippe-fournier-viger.com/spmf/ISMIS2014_FHM_Faster_High_utility_Itemset_Mining_PAPER.pdf)

据我们所知, FHM算法是解决这个问题的最快算法之一。结果表明,它的速度是HUI-Miner算法的六倍,是UP_Growth算法的100倍,是Two-Phase算法的1000倍。你可以去SPMF网站试试FHM算法和上面的其他算法。

在网站上,你将找到关于如何运行算法的说明以及数据集页面上的一些数据集。更新:最近,EFIM算法(2015年)被提出,并显示出超过FHM算法 1000倍,并且在SPMF中也有提供。(http://www.philippe-fournier-viger.com/MICAI2015_EFIM_High_Utility_Itemset_Mining.pdf)

 类似资料: