【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

2023-03-28 18:58:30 浏览数 (1)

文章目录

  • 一、 置信度
  • 二、 置信度 示例

参考博客 :

  • 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
  • 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )

一、 置信度


关联规则

rm X Rightarrow Y

的置信度 ,

表示 数据集

rm D

中包含

rm X

项集的事物 , 同时有多大可能性包含

rm Y

项集 ,

等于 项集

rm X cup Y

的支持度 与 项集

rm X

的支持度 比值 ;

公式为 :

rm confidence (X Rightarrow Y) = cfrac{support (X cup Y)}{support (X)}

二、 置信度 示例


示例 : 数据集

rm D

为 :

事物编号

事物 ( 商品 )

001 001 001

奶粉 , 莴苣

002 002 002

莴苣 , 尿布 , 啤酒 , 甜菜

003 003 003

奶粉 , 尿布 , 啤酒 , 橙汁

004 004 004

奶粉 , 莴苣 , 尿布 , 啤酒

005 005 005

奶粉 , 莴苣 , 尿布 , 橙汁

001

奶粉 , 莴苣

002

莴苣 , 尿布 , 啤酒 , 甜菜

003

奶粉 , 尿布 , 啤酒 , 橙汁

004

奶粉 , 莴苣 , 尿布 , 啤酒

005

奶粉 , 莴苣 , 尿布 , 橙汁

求关联规则

rm 尿布 Rightarrow 啤酒

的置信度

?

根据上述公式

rm confidence (X Rightarrow Y) = cfrac{support (X cup Y)}{support (X)}

计算

rm X Rightarrow Y

置信度 ;

1 . 计算

rm support (X cup Y)

支持度 :

rm Support (X Rightarrow Y) = Support (X cup Y) = cfrac{count (X cup Y)}{count (D)}
rm support (X cup Y)

指的是 数据集

rm D

中含有项集

rm X cup Y

的事务个数 ;

含有

rm X cup Y={ 尿布 , 啤酒 }

项集的事务有 事务

rm 2

, 事务

3

, 事务

4

, 得出 :

rm count (X cup Y) = 3
rm count(D)

指的是 数据集

rm D

的事务总数 ; 得出

rm count(D) = 5

计算支持度结果 :

rm Support (X Rightarrow Y) = Support (X cup Y) = cfrac{count (X cup Y)}{count (D)}
rm Support (X) = Support (X cup Y) = cfrac{3}{5}

2 . 计算

rm Support (X)

支持度 , 项集

rm X={ 奶粉 }

根据上述公式

rm Support (X) = cfrac{count (X)}{count (D)}

计算支持度 ;

rm count (X)

指的是 数据集

rm D

中含有项集

rm X

的事务个数 ;

含有

rm X={ 奶粉 }

项集的事务有 事务

rm 1

, 事务

3

, 事务

4

, 事务

5

, 得出 :

rm count (X) = 4
rm count(D)

指的是 数据集

rm D

的事务总数 ; 得出

rm count(D) = 5

则计算支持度 :

rm Support (X) = cfrac{count (X)}{count (D)}
rm Support (X) = cfrac{4}{5}

3 . 求最终置信度

rm confidence (X Rightarrow Y) = cfrac{support (X cup Y)}{support (X)}
rm confidence (X Rightarrow Y) = cfrac{ dfrac{3}{5}}{dfrac{4}{5}} = cfrac{3}{4}

最终置信度为

cfrac{3}{4}

0 人点赞