一、概述
杰卡德距离(Jaccard Distance),是用来衡量两个集合差异性的一种指标,它是杰卡德相似系数的补集。
二、计算公式
① 杰卡德相似系数
杰卡德相似系数(Jaccard similarity coefficient):两个集合 A 和 B 的交集元素在 A,B 的并集中所占的比例,称为两个集合的杰卡德相似系数,用符号
表示,则其表达式为:
② 杰卡德距离
杰卡德距离(Jaccard Distance):与杰卡德相似系数相反,用两个集合中不同元素占所有元素的比例来衡量两个集合的区分度。杰卡德距离的表达式为: