excelperfect
在文章开始之前,解释一下什么是不同值?什么是唯一值?
例如,下面的一组数据:
a,a,b,b,c,d,e,e,f
我们说,这组数据有6个不同值:a,b,c,d,e,f;有3个唯一值:c,d,f,因为它们在列表中只出现了1次。
我们要求这组数据中不同值的数量,可以使用数组公式:
=SUM(--(FREQUENCY(IF(A1:A9<>"",MATCH("~"& A1:A9,A1:A9&"",0)),ROW(A1:A9)-ROW(A1) 1)>0))
结果如下图1所示。
图1
然而,这个公式不仅复杂,而且在处理混合数据时会很慢。因此,我们可以使用VBA来编写自定义函数。
使用Collection对象来统计不同值
代码如下:
代码语言:javascript复制Public Function COUNTDISTINCTcol(ByRef rngToCheck As Range) As Variant
Dim colDistinct As Collection
Dim varValues As Variant
Dim varValue As Variant
Dim lngCount As Long
Dim lngRow As Long
Dim lngCol As Long
On Error GoTo ErrorHandler
varValues= rngToCheck.Value
'如果rngToCheck多于1个单元格
'那么varValues是一个二维数组
If IsArray(varValues) Then
Set colDistinct = New Collection
For lngRow = LBound(varValues, 1) To UBound(varValues, 1)
For lngCol = LBound(varValues, 2) To UBound(varValues, 2)
varValue = varValues(lngRow, lngCol)
'忽略空单元格
'如果单元格包含错误值则触发错误
If LenB(varValue) > 0 Then
'如果该项已存在则会触发错误
'忽略该错误
On Error Resume Next
colDistinct.Add vbNullString, CStr(varValue)
On Error GoTo ErrorHandler
End If
Next lngCol
Next lngRow
lngCount = colDistinct.Count
Else
If LenB(varValues) > 0 Then
lngCount = 1
End If
End If
COUNTDISTINCTcol = lngCount
Exit Function
ErrorHandler:
COUNTDISTINCTcol = CVErr(xlErrValue)
End Function
集合中的每个项目都必须具有唯一键,并且该唯一键必须是字符串。如果代码尝试创建重复键,则会引发错误。由于OnError Resume Next语句,该错误被忽略。VBACollection 对象的一个特性是键不区分大小写。
LenB函数用于检查单元格是否为空白。如果单元格包含错误值,则此时将引发错误并且自定义函数将返回#VALUE!。空单元格意味着:
- 单元格中什么也没有
- 有一个零长字符串
- 仅仅有一个前缀符号(通常是’)
使用Dictionary对象来统计不同值
在编写代码前,先添加对MicrosoftScripting Runtime库的引用。在VBE中,单击“工具——引用”,找到并勾选“MicrosoftScripting Runtime”,如下图2所示。
图2
代码如下:
代码语言:javascript复制Public Function COUNTDISTINCTdicNew(ByRef rngToCheck As Range) As Variant
'早期绑定
'需要引用Microsoft Scripting Runtime库
Dim dicDistinct As Scripting.Dictionary
Dim varValues As Variant
Dim varValue As Variant
Dim lngCount As Long
Dim lngRow As Long
Dim lngCol As Long
Dim strValue As String
On Error GoTo ErrorHandler
varValues= rngToCheck.Value
'如果rngToCheck多于1个单元格
'那么varValues是一个二维数组
If IsArray(varValues) Then
Set dicDistinct = CreateObject("Scripting.Dictionary")
dicDistinct.CompareMode = TextCompare
For lngRow = LBound(varValues, 1) To UBound(varValues, 1)
For lngCol = LBound(varValues, 2) To UBound(varValues, 2)
varValue = varValues(lngRow, lngCol)
'忽略空单元格
'如果单元格包含错误值则触发错误
If LenB(varValue) > 0 Then
'将所有内容转换为字符串
'字典对类型不敏感
strValue = CStr(varValue)
If Not dicDistinct.Exists(strValue) Then
dicDistinct.Add strValue, vbNullString
End If
End If
Next lngCol
Next lngRow
lngCount = dicDistinct.Count
Else
If LenB(varValues) > 0 Then
lngCount = 1
End If
End If
COUNTDISTINCTdicNew = lngCount
Exit Function
ErrorHandler:
COUNTDISTINCTdicNew = CVErr(xlErrValue)
End Function
这段代码在第一次调用后保留现有Dictionary对象并随后清除。使用Static关键字代替Dim,以便在函数调用之间保留Dictionary对象引用:
代码语言:javascript复制Public Function COUNTDISTINCTdicStatic(ByRef rngToCheck As Range) As Variant
Static dicDistinct As Scripting.Dictionary
Dim varValues As Variant
Dim varValue As Variant
Dim lngCount As Long
Dim lngRow As Long
Dim lngCol As Long
Dim strValue As String
On Error GoTo ErrorHandler
varValues= rngToCheck.Value
'如果rngToCheck多于1个单元格
'那么varValues是一个二维数组
If IsArray(varValues) Then
If dicDistinct Is Nothing Then
Set dicDistinct = CreateObject("Scripting.Dictionary")
dicDistinct.CompareMode = TextCompare
Else
dicDistinct.RemoveAll
End If
For lngRow = LBound(varValues, 1) To UBound(varValues, 1)
For lngCol = LBound(varValues, 2) To UBound(varValues, 2)
varValue = varValues(lngRow, lngCol)
'忽略空单元格
'如果单元格包含错误值则触发错误
If LenB(varValue) > 0 Then
'将所有内容转换为字符串
'字典对类型不敏感
strValue = CStr(varValue)
If Not dicDistinct.Exists(strValue) Then
dicDistinct.Add strValue, vbNullString
End If
End If
Next lngCol
Next lngRow
lngCount = dicDistinct.Count
Else
If LenB(varValues) > 0 Then
lngCount = 1
End If
End If
COUNTDISTINCTdicStatic = lngCount
Exit Function
ErrorHandler:
COUNTDISTINCTdicStatic = CVErr(xlErrValue)
End Function
下面是上述方式统计不同值的结果,如下图3所示。
图3
正如所看到的,这4个公式都对数据类型不敏感,也对大小写不敏感。
扩展的不同值统计——Dictionary对象
代码如下:
代码语言:javascript复制Public Function COUNTDISTINCT(ByRef rngToCheck AsRange, _
Optional ByVal blnCaseSensitive As Boolean = True) As Variant
Static dicDistinctAs Scripting.Dictionary
Dim varValues As Variant
Dim varValue As Variant
Dim lngCount As Long
Dim lngRow As Long
Dim lngCol As Long
On Error GoTo ErrorHandler
Set rngToCheck = Intersect(rngToCheck.Worksheet.UsedRange, rngToCheck)
If No trngToCheck Is Nothing Then
'将单元格值分配到内存中
'以便更快地使用它们
varValues = rngToCheck.Value
'如果rngToCheck多于1个单元格
'那么varValues是一个二维数组
If IsArray(varValues) Then
If dicDistinct Is Nothing Then
Set dicDistinct = CreateObject("Scripting.Dictionary")
dicDistinct.CompareMode = BinaryCompare
Else
dicDistinct.RemoveAll
End If
For lngRow = LBound(varValues, 1) ToUBound(varValues, 1)
For lngCol = LBound(varValues, 2) To UBound(varValues, 2)
varValue = varValues(lngRow, lngCol)
'忽略错误值
If Not IsError(varValue) Then
'忽略空单元格
'包括公式返回的""
If LenB(varValue) >0 Then
'如果是字符串
'那么允许区分大小写
If VarType(varValue) = vbString Then
If Not blnCaseSensitive Then
varValue =UCase(varValue)
End If
End If
If Not dicDistinct.Exists(varValue)Then
dicDistinct.AddvarValue, vbNullString
End If
End If
End If
Next lngCol
Next lngRow
lngCount = dicDistinct.Count
Else
'如果单元格包含错误或为空则忽略
If Not IsError(varValues) Then
If LenB(varValues) > 0 Then
lngCount = 1
End If
End If
End If
End If
COUNTDISTINCT = lngCount
Exit Function
ErrorHandler:
COUNTDISTINCT = CVErr(xlErrValue)
End Function
注意以下几点:
- 可以统计数字、文本和逻辑数据类型,但会忽略错误值,例如#N/A和DIV/0!。
- 忽略空(和空白)单元格。
- 默认情况下区分大小写。
- 区分数据类型。例如,这两个公式将被认为是不同的:=TRUE()和="True",就像 ="1" 和 =1。
- 需要对 MicrosoftScripting Runtime 库的引用。如果不包含引用,则需要将Dictionary 对象声明为 Object类型,并将BinaryCompare设置为等于0的常量。
- 可以处理跨多列的数据。
示例如下图4所示。
图4
扩展的唯一值统计——Dictionary对象
与上面的代码相似:
代码语言:javascript复制Public Function COUNTUNIQUE(ByRef rngToCheck AsRange, _
Optional ByVal blnCaseSensitive As Boolean = True) As Variant
Static dicDistinct As Object
Dim varValues As Variant
Dim varValue As Variant
Dim varItems As Variant
Dim lngCount As Long
Dim lngItem As Long
Dim lngRow As Long
Dim lngCol As Long
On Error GoTo ErrorHandler
Set rngToCheck = Intersect(rngToCheck.Worksheet.UsedRange, rngToCheck)
If Not rngToCheck Is Nothing Then
'将单元格值分配到内存中
'以便更快地使用它们
varValues = rngToCheck.Value
'如果rngToCheck多于1个单元格
'那么varValues是一个二维数组
If IsArray(varValues) Then
If dicDistinct Is Nothing Then
Set dicDistinct = CreateObject("Scripting.Dictionary")
dicDistinct.CompareMode = BinaryCompare
Else
dicDistinct.RemoveAll
End If
For lngRow = LBound(varValues, 1) To UBound(varValues, 1)
For lngCol = LBound(varValues, 2) To UBound(varValues, 2)
varValue = varValues(lngRow, lngCol)
'忽略错误值
If Not IsError(varValue) Then
'忽略空单元格
'包括公式返回的""
If LenB(varValue) >0 Then
'如果是字符串
'那么允许区分大小写
If VarType(varValue) = vbString Then
If NotblnCaseSensitive Then
varValue =UCase(varValue)
End If
End If
'如果已存在则统计其出现了多少次
If dicDistinct.Exists(varValue) Then
dicDistinct.Item(varValue) = dicDistinct.Item(varValue) 1
Else
'添加其出现1次
dicDistinct.AddvarValue, 1
End If
End If
End If
Next lngCol
Next lngRow
'仅对出现一次的项
varItems = dicDistinct.Items
For lngItem = LBound(varItems, 1) To UBound(varItems, 1)
If varItems(lngItem) = 1 Then
lngCount = lngCount 1
End If
Next lngItem
Else
'如果单元格包含错误或为空则忽略
If Not IsError(varValues) Then
If LenB(varValues) > 0 Then
lngCount = 1
End If
End If
End If
End If
COUNTUNIQUE = lngCount
Exit Function
ErrorHandler:
COUNTUNIQUE = CVErr(xlErrValue)
End Function
结果如下图5所示。
图5
注:本文整理自colinlegg.wordpress.com,供有兴趣的朋友学习参考。