theme: arknights
携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第13天,点击查看活动详情
推荐阅读
- CSDN主页
- GitHub开源地址
- Unity3D插件分享
- 简书地址
- 我的个人博客
- QQ群:1040082875
大家好,我是小魔龙,Unity3D软件工程师,VR、AR,虚拟仿真方向,不定时更新软件开发技巧,生活感悟,觉得有用记得一键三连哦。
一、题目
1、算法题目
“给定一个标识DNA蓄力的字符串s,返回所有在DNA分子中出现不止一次的长度为10的序列。”
题目链接:
来源:力扣(LeetCode)
链接: 187. 重复的DNA序列 - 力扣(LeetCode)
2、题目描述
DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。
- 例如,"ACGAATTCCG" 是一个 DNA序列 。 在研究 DNA 时,识别 DNA 中的重复序列非常有用。
给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
代码语言:javascript复制示例 1:
输入: s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出: ["AAAAACCCCC","CCCCCAAAAA"]
代码语言:javascript复制示例 2:
输入: s = "AAAAAAAAAAAAA"
输出: ["AAAAAAAAAA"]
二、解题
1、思路分析
这道题是要求出重复的字符串s,重复的元素容易想到的就是使用哈希表。
键是字符串的子串,值是出现的次数,返回所有次数出现超过10次的子串即可。
2、代码实现
代码参考:
代码语言:javascript复制class Solution {
static final int L = 10;
public List<String> findRepeatedDnaSequences(String s) {
List<String> ans = new ArrayList<String>();
Map<String, Integer> cnt = new HashMap<String, Integer>();
int n = s.length();
for (int i = 0; i <= n - L; i) {
String sub = s.substring(i, i L);
cnt.put(sub, cnt.getOrDefault(sub, 0) 1);
if (cnt.get(sub) == 2) {
ans.add(sub);
}
}
return ans;
}
}
3、时间复杂度
时间复杂度:O(NL)
其中N是字符串s的长度,L=10即目标子串的长度。
空间复杂度:O(NL)
其中N是字符串s的长度,L是目标子串的长度。
三、总结
这道题还可以使用滑动窗口来优化时间复杂度。
当前时间复杂度是O(NL),其中N是字符串s的长度,L是目标子串的长度。
为了优化时间复杂度,可以定义一个大小为10的滑动窗口来计算子串的整数,设当前滑动窗口对应的整数表示为x。
当计算下一个子串时,将滑动窗口向右移动一位,此时新字符进入窗口,窗口左边的字符离开窗口。
将上面的步骤结合,就可以用O(1)的时间计算出下一个子串的整数表示。