BitMap算法 .net实现 用于去重并且排序,适用于大型权限管理 ,大数据去重排序

2020-08-31 13:30:50 浏览数 (1)

BitMap利用byte特性 针对排序 去重 最佳实践: 100万条数据的排序 去重用时200毫秒左右

代码语言:javascript复制
  static void Main(string[] args)
        {
            int[] data = new int[10000000];
            /*alias*/
            Random r = new Random();
            for (int i = 0; i < data.Length; i  )
            {
                data[i] = r.Next(1, 10000000);
            }
            Stopwatch stop = new Stopwatch();
            stop.Start();
            List<byte> lstbyte = new List<byte>();
            foreach (var item in data)
            {
                int unit = item / 8;
                int index = item % 8;
                if (lstbyte.Count <= unit)
                {
                    lstbyte.AddRange(new byte[unit-lstbyte.Count   1]);
                }
                lstbyte[unit] = set_bit(lstbyte[unit], index   1, true);
            }
            List<int> result = new List<int>();
            for (int i = 0; i < lstbyte.Count; i  )
            {
                int currentIndex = i*8;
                List<int> lstint = new List<int>();
                if (lstbyte[i] > 0)
                {
                    /**
                     * 这段代码用于判断,byte对应位置的值是否有1
                     * 例如: 目标 byte:0010 0001 
                     *  0010 0001 & 0000 0001 结果为1则 第一位为1
                     *  第二位比较方式就是目标byte和 0010 0001 & 0000 0010
                     *  为避免频繁的装箱拆箱操作,这里不用通过 Math.Pow计算平2的平方立方来得到目标比较数。
                     */
                    int b = lstbyte[i] & 0x01;
                    if (b  == 1)
                    {
                        lstint.Add(currentIndex 0);
                    }
                    b = lstbyte[i] & 0x02;
                    if (b == 2)
                    {
                        lstint.Add(currentIndex   1);
                    }
                    b = lstbyte[i] & 0x04;
                    if (b == 4)
                    {
                        lstint.Add(currentIndex   2);
                    }
                    b = lstbyte[i] & 0x08;
                    if (b == 8)
                    {
                        lstint.Add(currentIndex   3);
                    }
                    b = lstbyte[i] & 0x10;
                    if (b == 16)
                    {
                        lstint.Add(currentIndex   4);
                    }
                    b = lstbyte[i] & 0x20;
                    if (b == 32)
                    {
                        lstint.Add(currentIndex   5);
                    }
                    b = lstbyte[i] & 0x40;
                    if (b == 64)
                    {
                        lstint.Add(currentIndex   6);
                    }
                    b = lstbyte[i] & 0x80;
                    if (b == 128)
                    {
                        lstint.Add(currentIndex   7);
                    }
                }
                result.AddRange(lstint);
            }
            stop.Stop();
            Console.WriteLine("结果数:" result.Count);
            //foreach (var item in result)
            //{
            //    Console.WriteLine(item);
            //}
            Console.WriteLine(string.Concat("时间:" ,stop.ElapsedMilliseconds ,"毫秒"));
            Console.ReadKey();
        }
        /// <summary>
        /// 设置某一位的值
        /// </summary>
        /// <param name="data"></param>
        /// <param name="index">要设置的位, 值从低到高为 1-8</param>
        /// <param name="flag">要设置的值 true / false</param>
        /// <returns></returns>
        static byte set_bit(byte data, int index, bool flag)
        {
            if (index > 8 || index < 1)
                throw new ArgumentOutOfRangeException();
            int v = index < 2 ? index : (2 << (index - 2));
            return flag ? (byte)(data | v) : (byte)(data & ~v);
        }

运行速度和待排序去重的最大数的大小有关系

0 人点赞