文章目录
- 一、 非频繁项集超集性质
- 二、 频繁项集子集性质
- 三、 项集与超集支持度性质
参考博客 :
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )
一、 非频繁项集超集性质
关联规则 性质 1 : 非频繁项集 的 超集 一定是 非频繁的 ;
超集 就是 包含 该集合的集合 ;
项集
是 非频繁项集 ,
项集
是 项集
的超集 ,
( 使用集合表示 :
, 项集
包含 项集
, 并且 项集
不为空集 )
则 项集
一定是 非频繁的 ;
举例 :
数据集
为 :
事物编号 | 事物 ( 商品 ) |
---|---|
001 001 001 | 奶粉 , 莴苣 |
002 002 002 | 莴苣 , 尿布 , 啤酒 , 甜菜 |
003 003 003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
004 004 004 | 奶粉 , 莴苣 , 尿布 , 啤酒 |
005 005 005 | 奶粉 , 莴苣 , 尿布 , 橙汁 |
奶粉 , 莴苣
莴苣 , 尿布 , 啤酒 , 甜菜
奶粉 , 尿布 , 啤酒 , 橙汁
奶粉 , 莴苣 , 尿布 , 啤酒
奶粉 , 莴苣 , 尿布 , 橙汁
项集
项集
上述
就是
的 超集 ,
项集
其支持度是
, 小于最小支持度
, 是 非频繁项集
那么
也是 非频繁项集 ;
在具体算法中会使用该性质 , 用于进行 “剪枝” 操作 ;
计算支持度时 , 按照
项集 支持度 ,
项集 支持度 ,
顺序进行计算 ,
如果发现
项集 中有 非频繁项集 , 则包含该
项集的
项集 肯定是 非频繁项集 ;
然后使用 频繁
项集 组合成
项集 , 然后再计算这些
项集是否是频繁项集 ;
“剪枝” 操作 减少了不必要的计算量 ;
二、 频繁项集子集性质
频繁项集 的 所有非空子集 , 一定是 频繁项集 ;
项集
是 频繁项集 ,
项集
是 项集
的超集 ,
( 使用集合表示 :
, 项集
包含 项集
, 并且 项集
不为空集 )
则 项集
一定是 频繁的 ;
举例 :
数据集
为 :
事物编号 | 事物 ( 商品 ) |
---|---|
001 001 001 | 奶粉 , 莴苣 |
002 002 002 | 莴苣 , 尿布 , 啤酒 , 甜菜 |
003 003 003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
004 004 004 | 奶粉 , 莴苣 , 尿布 , 啤酒 |
005 005 005 | 奶粉 , 莴苣 , 尿布 , 橙汁 |
奶粉 , 莴苣
莴苣 , 尿布 , 啤酒 , 甜菜
奶粉 , 尿布 , 啤酒 , 橙汁
奶粉 , 莴苣 , 尿布 , 啤酒
奶粉 , 莴苣 , 尿布 , 橙汁
项集
,
项集
项集
其支持度是
, 等于最小支持度
, 是 频繁项集
那么
项集
的子集是
项集
,
,
根据上述性质 ,
项集
,
都是 频繁项集 ;
三、 项集与超集支持度性质
任意一个 项集 的 支持度 , 都 大于等于 其 超集 支持度 ;
超集 就是 包含 该集合的集合 ;