文章目录
- 一、 Apriori 算法过程
- 二、 Apriori 算法示例
参考博客 :
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )
一、 Apriori 算法过程
原始数据集
,
项集
,
项集
,
,
项集
, 这些项集都是候选项集 ,
根据 原始数据集
, 创造
项集
, 然后对
执行 数据集扫描函数 , 找到其中的 频繁
项集
,
根据 频繁
项集
, 创造
项集
, 然后对
执行 数据集扫描函数 , 找到其中的 频繁
项集
,
根据 频繁
项集
, 创造
项集
, 然后对
执行 数据集扫描函数 , 找到其中的 频繁
项集
,
二、 Apriori 算法示例
事物编号 | 事物 ( 商品 ) |
---|---|
001 001 001 | 奶粉 , 莴苣 |
002 002 002 | 莴苣 , 尿布 , 啤酒 , 甜菜 |
003 003 003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
004 004 004 | 奶粉 , 莴苣 , 尿布 , 啤酒 |
005 005 005 | 奶粉 , 莴苣 , 尿布 , 橙汁 |
奶粉 , 莴苣
莴苣 , 尿布 , 啤酒 , 甜菜
奶粉 , 尿布 , 啤酒 , 橙汁
奶粉 , 莴苣 , 尿布 , 啤酒
奶粉 , 莴苣 , 尿布 , 橙汁
最小支持度阈值为
根据 原始数据集
, 创造
项集
, 然后对
执行 数据集扫描函数 , 找到其中的 频繁
项集
,
项集
支持度
项集
支持度
项集
支持度
项集
支持度
项集
支持度
项集
支持度
项集中只有
,
,
,
是频繁
项集 ;
根据 频繁
项集
, 创造
项集
, 然后对
执行 数据集扫描函数 , 找到其中的 频繁
项集
,
项集
支持度
项集
支持度
项集
支持度
项集
支持度
项集
支持度
项集
支持度
项集中只有
,
,
,
是 频繁
项集 ;
根据 频繁
项集
, 创造
项集
, 然后对
执行 数据集扫描函数 , 找到其中的 频繁
项集
,
项集
支持度
项集
支持度
项集
支持度
项集
支持度
项集中没有频繁项集 ;