☆打卡算法☆LeetCode 187. 重复的DNA序列 算法解析

2022-09-20 19:58:51 浏览数 (1)


theme: arknights

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第13天,点击查看活动详情

推荐阅读

  • CSDN主页
  • GitHub开源地址
  • Unity3D插件分享
  • 简书地址
  • 我的个人博客
  • QQ群:1040082875

大家好,我是小魔龙,Unity3D软件工程师,VR、AR,虚拟仿真方向,不定时更新软件开发技巧,生活感悟,觉得有用记得一键三连哦。

一、题目

1、算法题目

“给定一个标识DNA蓄力的字符串s,返回所有在DNA分子中出现不止一次的长度为10的序列。”

题目链接:

来源:力扣(LeetCode)

链接: 187. 重复的DNA序列 - 力扣(LeetCode)

2、题目描述

DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。

  • 例如,"ACGAATTCCG" 是一个 DNA序列 。 在研究 DNA 时,识别 DNA 中的重复序列非常有用。

给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。

代码语言:javascript复制
示例 1:
输入: s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出: ["AAAAACCCCC","CCCCCAAAAA"]
代码语言:javascript复制
示例 2:
输入: s = "AAAAAAAAAAAAA"
输出: ["AAAAAAAAAA"]

二、解题

1、思路分析

这道题是要求出重复的字符串s,重复的元素容易想到的就是使用哈希表。

键是字符串的子串,值是出现的次数,返回所有次数出现超过10次的子串即可。

2、代码实现

代码参考:

代码语言:javascript复制
class Solution {
    static final int L = 10;

    public List<String> findRepeatedDnaSequences(String s) {
        List<String> ans = new ArrayList<String>();
        Map<String, Integer> cnt = new HashMap<String, Integer>();
        int n = s.length();
        for (int i = 0; i <= n - L;   i) {
            String sub = s.substring(i, i   L);
            cnt.put(sub, cnt.getOrDefault(sub, 0)   1);
            if (cnt.get(sub) == 2) {
                ans.add(sub);
            }
        }
        return ans;
    }
}

3、时间复杂度

时间复杂度:O(NL)

其中N是字符串s的长度,L=10即目标子串的长度。

空间复杂度:O(NL)

其中N是字符串s的长度,L是目标子串的长度。

三、总结

这道题还可以使用滑动窗口来优化时间复杂度。

当前时间复杂度是O(NL),其中N是字符串s的长度,L是目标子串的长度。

为了优化时间复杂度,可以定义一个大小为10的滑动窗口来计算子串的整数,设当前滑动窗口对应的整数表示为x。

当计算下一个子串时,将滑动窗口向右移动一位,此时新字符进入窗口,窗口左边的字符离开窗口。

将上面的步骤结合,就可以用O(1)的时间计算出下一个子串的整数表示。

0 人点赞