上篇文章分享的是暴力解决方法.暴力法非常简单,但是它的速度不够快!那么我们该如何去做优化了?
算法题
- 题目
Given a string, find the length of the longest substring without repeating characters.
- Example
- Given "abcabcbb", the answer is "abc", which the length is 3.
- Given "bbbbb", the answer is "b", with the length of 1.
- Given "pwwkew", the answer is "wke", with the length of
- Note that the answer must be a substring, "pwke" is a subsequence and not a substring.
算法题解读
- 题目大意:给定一个字符串,找出不含有重复字符的最长子串的长度
- 解读Example
- 给定"abcabcbb",没有重复字符的最长子串是"abc",那么长度就是3
- 给定"bbbbb",最长子串就是"b",长度就是1
- 给定pwwkew,最长子串就是"wke",长度为3,
- ==注意,==必须是一个子串."pwke",是子序列,而不是子串
"滑动窗口法"优化解决
使用暴力法解决是非常简单,但是在暴力法中我们会反复检查一个子字符串是否含有重复的字符.但其实没有这个必要.
前导关键词介绍
- HashSet
HashSet
是Java
中实现Set
接口.由哈希表支持.它不保证Set的迭代顺序,但是它利用Hash的原理来确保元素的唯一性.在HashSet
中,元素都存到HashMap
键值对的key上面.而Value
时有一个统一的Hash
值. - HashSet的插入
当有新的值加入时,底层的
HashMap
会判断Key值是否存在,如果不存在则插入新值.同时这个插入的细节会按照HashMap
插入细节.如果存在则不插入. - 滑动窗口
是指的是数组/字符串问题的常用抽象概念.窗口通常在数组/字符串中由开始和结束的索引定义的一系列元素的集合.即可[
i,j)(左闭,右开)
.而滑动窗口是可以将2个边界向某一个方向"滑动"的窗口.例如,我们将[i,j)
向右滑动1个元素,则它将变成[i 1,j 1)(左闭,右开)
;
思路
如果从索引i到j-1
之间的子字符串S[ij]
已经被检查为没有重复字符.那则只需要检查s[j]
对应的字符是否存在于子字符串s[ij]
;
由于在C语言中是没有集合这一个概念的.所以我们使用java来实现.我们可以通过HashSet作为活动窗口.那我们只需要用O(1)的时间来完成对字符是否在当前子字符串的检查.
我们使用HashSet
将字符存储在当前窗口[i,j),最初i=j
.然后我们向右侧滑动索引j
,如果它不在HashSet
中,则我们会继续滑动j
.直到s[j]
已经存在于HashSet
中,此时,我们就已经找到的没有重复字符的最长子串将会以索引i
开头.如果我们将所有的i
,都做如此操作即可得到结果.
实现
Java Code
复杂度分析
- 时间复杂度:
o(2n) = o(n)
;在最糟糕的情况下,每个字符顶多被i,j访问2次. - 空间复杂度:
o(min(m,n))
.窗口滑动法需要O(K)的空间,K指的是集合大小.而集合的大小取决于字符串n的大小以及字符串集的大小.
算法面试系列文章:
BAT面试算法进阶(1)--两数之和 BAT面试算法进阶(2)- 无重复字符的最长子串(暴力法) BAT面试算法进阶(4)- 无重复字符的最长子串(滑动法优化 ASCII码法) BAT面试算法进阶(5)- BAT面试算法进阶(5)- 最长回文子串(方法一) BAT面试算法进阶(6)- BAT面试算法进阶(6)-最长回文子串(方法二) BAT面试算法进阶(7)- 反转整数 BAT面试算法进阶(8)- 删除排序数组中的重复项 BAT面试算法进阶(9)- 三维形体投影面积 BAT面试算法进阶(10)- 最长的斐波那契子序列的长度(暴力法) BAT面试算法进阶(11)- 最长的斐波那契子序列的长度(动态规划法) BAT面试算法进阶(12)- 环形链表(哈希表法)
还不赶紧