文章目录
- 一、 置信度
- 二、 置信度 示例
参考博客 :
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
- 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )
一、 置信度
关联规则
的置信度 ,
表示 数据集
中包含
项集的事物 , 同时有多大可能性包含
项集 ,
等于 项集
的支持度 与 项集
的支持度 比值 ;
公式为 :
二、 置信度 示例
示例 : 数据集
为 :
事物编号 | 事物 ( 商品 ) |
---|---|
001 001 001 | 奶粉 , 莴苣 |
002 002 002 | 莴苣 , 尿布 , 啤酒 , 甜菜 |
003 003 003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
004 004 004 | 奶粉 , 莴苣 , 尿布 , 啤酒 |
005 005 005 | 奶粉 , 莴苣 , 尿布 , 橙汁 |
奶粉 , 莴苣
莴苣 , 尿布 , 啤酒 , 甜菜
奶粉 , 尿布 , 啤酒 , 橙汁
奶粉 , 莴苣 , 尿布 , 啤酒
奶粉 , 莴苣 , 尿布 , 橙汁
求关联规则
的置信度
根据上述公式
计算
置信度 ;
1 . 计算
支持度 :
指的是 数据集
中含有项集
的事务个数 ;
含有
项集的事务有 事务
, 事务
, 事务
, 得出 :
指的是 数据集
的事务总数 ; 得出
计算支持度结果 :
2 . 计算
支持度 , 项集
根据上述公式
计算支持度 ;
指的是 数据集
中含有项集
的事务个数 ;
含有
项集的事务有 事务
, 事务
, 事务
, 事务
, 得出 :
指的是 数据集
的事务总数 ; 得出
则计算支持度 :
3 . 求最终置信度
最终置信度为