专栏:优选算法
1.题目
438. 找到字符串中所有字母异位词
给定两个字符串 s
和 p
,找到 s
中所有 p
的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。
异位词 指由相同字母重排列形成的字符串(包括相同的字符串)。
示例 1:
代码语言:javascript复制输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。
示例 2:
代码语言:javascript复制输入: s = "abab", p = "ab"
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的异位词。
提示:
1 <= s.length, p.length <= 3 * 104
s
和p
仅包含小写字母
2.题目理解
“abc”的异位词 有:abc,acb,bac,bca,cab,cba;
输出: [0,6](子串的起始索引)
3.算法原理
1.如何快速判断两个字符串是否是异位词
1.两个字符串都按照字符顺序排序,然后比较是否相等 排序 比较 nlogn n
2.统计每个字符出现的次数 哈希表遍历比较
2.解决问题
暴力求解——>滑动窗口 哈希表
因为字符串p 的异位词的⻓度“m”⼀定与字符串p的⻓度相同,所以我们可以在字符串 s 中构 造⼀个⻓度为与字符串 p 的⻓度相同的滑动窗⼝,并在滑动中维护窗⼝中每种字⺟的数量;保持窗口大小一次遍历比较。
滑动窗口
利用滑动窗口 哈希表解决问题
可以⽤两个⼤⼩为 26 的数组来模拟哈希表,⼀个来保存 s 中的⼦串每个字符出现的个 数,另⼀个来保存 p 中每⼀个字符出现的个数。这样就能判断两个串是否是异位词。
优化:更新结果的判断条件
利用变化量count来统计窗口中“有效字符的次数”;
当窗⼝中每种字⺟的数量与字符串p中每种字⺟的数量相同时,则说明当前窗⼝为字符串 p 的异位词;
4.编程代码
C 代码
代码语言:javascript复制class Solution
{
public:
vector<int> findAnagrams(string s, string p)
{
vector<int> ret;
int hash1[26] = { 0 }; // 统计字符串 p 中每个字符出现的个数
for(auto ch : p) hash1[ch - 'a'] ;
int hash2[26] = { 0 }; // 统计窗⼝⾥⾯的每⼀个字符出现的个数
int m = p.size();
for(int left = 0, right = 0, count = 0; right < s.size(); right )
{
char in = s[right];
// 进窗⼝ 维护 count
if( hash2[in - 'a'] <= hash1[in - 'a']) count ;
if(right - left 1 > m) // 判断
{
char out = s[left ];
// 出窗⼝ 维护 count
if(hash2[out - 'a']-- <= hash1[out - 'a']) count--;
}
// 更新结果
if(count == m) ret.push_back(left);
}
return ret;
}
};
1.频率统计
代码语言:javascript复制for(auto ch : p) hash1[ch - 'a'] ;
- 范围
for
循环: 用于遍历字符串p
,并统计每个字符的出现次数。 - 字符偏移量
ch - 'a'
: 将字符转换为数组索引,例如'a'
对应0
,'b'
对应1
。
2. 双指针
- 初始化指针和计数器
left
,right
,count
:left
和right
分别表示窗口的左边界和右边界,count
用于记录匹配字符的数量。 - 滑动窗口
for
循环: 遍历字符串s
,右指针right
不断向右移动。 - 进窗口操作: 将
s[right]
加入窗口并更新频率数组hash2
。如果该字符的频率没有超过hash1
中的频率,则计数器count
加一。 - 出窗口操作: 当窗口大小超过
m
时,将s[left]
移出窗口,并更新频率数组hash2
和计数器count
。 - 更新结果: 如果
count
等于m
,说明当前窗口是一个字母异位词,记录起始索引left
。
C语言代码
代码语言:javascript复制int* findAnagrams(char * s, char * p, int* returnSize) {
int s_len = strlen(s); // 使用 strlen 计算字符串 s 的长度
int p_len = strlen(p); // 使用 strlen 计算字符串 p 的长度
int *ret = (int *)malloc(s_len * sizeof(int));
*returnSize = 0;
int hash1[26] = {0}; // 统计字符串 p 中每个字符出现的个数
for (int i = 0; i < p_len; i ) {
hash1[p[i] - 'a'] ;
}
int hash2[26] = {0}; // 统计窗口里面的每一个字符出现的个数
int count = 0;
for (int left = 0, right = 0; right < s_len; right ) {
char in = s[right];
// 进窗口 维护 count
if ( hash2[in - 'a'] <= hash1[in - 'a']) {
count ;
}
// 判断窗口是否超过大小
if (right - left 1 > p_len) {
char out = s[left ];
// 出窗口 维护 count
if (hash2[out - 'a']-- <= hash1[out - 'a']) {
count--;
}
}
// 更新结果
if (count == p_len) {
ret[*returnSize] = left;
(*returnSize) ;
}
}
return ret;
}
1.字符频率统计
代码语言:javascript复制 int hash1[26] = {0}; // 统计字符串 p 中每个字符出现的个数
for (int i = 0; i < p_len; i ) {
hash1[p[i] - 'a'] ;
}
hash1
:长度为26的整数数组,用于统计字符串p
中每个字符的出现次数。hash1[i]
表示字符'a' i
在字符串p
中的出现次数。- 循环遍历字符串
p
,更新hash1
数组。
2.滑动窗口机制
代码语言:javascript复制 int hash2[26] = {0}; // 统计窗口里面的每一个字符出现的个数
int count = 0;
for (int left = 0, right = 0; right < s_len; right ) {
char in = s[right];
// 进窗口 维护 count
if ( hash2[in - 'a'] <= hash1[in - 'a']) {
count ;
}
hash2
:长度为26的整数数组,用于统计滑动窗口内每个字符的出现次数。count
:记录当前滑动窗口内与字符串p
中字符频率一致的字符数。- 滑动窗口通过
right
指针不断向右移动,将字符s[right]
加入窗口,同时更新hash2
数组和count
计数。
3.判断窗口大小并维护窗口内字符频率
代码语言:javascript复制 // 判断窗口是否超过大小
if (right - left 1 > p_len) {
char out = s[left ];
// 出窗口 维护 count
if (hash2[out - 'a']-- <= hash1[out - 'a']) {
count--;
}
}
- 检查滑动窗口的大小,如果窗口大小超过字符串
p
的长度(right - left 1 > p_len
),则需要移除窗口左侧的字符。 - 更新
left
指针,移除窗口左侧字符,同时更新hash2
数组和count
计数。
4.更新结果
代码语言:javascript复制 // 更新结果
if (count == p_len) {
ret[*returnSize] = left;
(*returnSize) ;
}
}
return ret;
}
- 如果
count
等于字符串p
的长度,说明当前窗口内字符频率与字符串p
一致,将left
指针的值加入结果数组ret
。 - 更新结果数组的大小
*returnSize
。
C 知识点详解
- STL(Standard Template Library): 向量
vector
是 STL 的一部分,提供动态数组的功能。 - 范围
for
循环: C 11 引入的循环方式,简化了遍历操作。 - 字符数组与频率统计: 使用数组来记录字符出现的频率,并进行简单的数学运算实现高效统计。
- 双指针(Sliding Window)技巧: 通过两个指针控制一个窗口,用于高效地处理子串问题。
- 成员函数与类: 通过类和成员函数组织代码,方便管理和调用。
1. STL(Standard Template Library)
向量 vector
概述:vector
是 C 标准模板库(STL)中的一个动态数组,可以根据需要动态调整大小。
特点:
- 动态调整大小:
vector
可以在运行时自动扩展和收缩。 - 随机访问:支持使用索引进行随机访问,访问时间复杂度为 O(1)。
- 内部实现:使用连续的内存块存储元素,类似于数组。
示例代码:
代码语言:javascript复制#include <vector>
#include <iostream>
int main() {
std::vector<int> vec = {1, 2, 3, 4, 5};
// 添加元素到末尾
vec.push_back(6);
// 随机访问
std::cout << "Element at index 2: " << vec[2] << std::endl;
// 遍历向量
for(int i : vec) {
std::cout << i << " ";
}
return 0;
}
高级用法:
插入和删除:
代码语言:javascript复制#include <vector>
#include <iostream>
int main() {
std::vector<int> vec = {1, 2, 3, 4, 5};
// 在指定位置插入元素
vec.insert(vec.begin() 2, 99);
// 删除指定位置的元素
vec.erase(vec.begin() 4);
// 遍历向量
for(int i : vec) {
std::cout << i << " ";
}
return 0;
}
动态调整大小:
代码语言:javascript复制#include <vector>
#include <iostream>
int main() {
std::vector<int> vec(5, 10); // 创建一个大小为5的向量,初始值为10
vec.resize(10, 20); // 调整向量大小为10,新增的元素值为20
for(int i : vec) {
std::cout << i << " ";
}
return 0;
}
2. 范围 for
循环
概述:范围 for
循环是 C 11 引入的一种简化遍历容器的方式。
特点:
- 简化代码:不需要显式地定义迭代器或索引变量。
- 安全性:自动处理容器的边界,减少越界错误。
示例代码:
代码语言:javascript复制#include <vector>
#include <iostream>
int main() {
std::vector<int> vec = {1, 2, 3, 4, 5};
for(int i : vec) {
std::cout << i << " ";
}
return 0;
}
高级用法:
使用引用遍历并修改元素:
代码语言:javascript复制#include <vector>
#include <iostream>
int main() {
std::vector<int> vec = {1, 2, 3, 4, 5};
for(int& i : vec) {
i *= 2; // 每个元素乘以2
}
for(const int& i : vec) {
std::cout << i << " ";
}
return 0;
}
3. 字符数组与频率统计
概述:字符数组用于存储字符的频率信息,通常用于字符串相关的算法中。
实现:使用大小为 26 的数组来记录每个小写字母的出现次数,数组索引对应字母的偏移量(例如 'a' 对应索引 0,'b' 对应索引 1)。
特点:
- 高效:使用数组进行频率统计和比较,时间复杂度为 O(1)。
- 简单:数组索引和字符的偏移量直接对应,易于实现和理解。
示例代码:
代码语言:javascript复制#include <iostream>
#include <string>
int main() {
std::string s = "hello";
int freq[26] = {0};
for(char ch : s) {
freq[ch - 'a'] ;
}
for(int i = 0; i < 26; i) {
if (freq[i] > 0) {
std::cout << (char)('a' i) << ": " << freq[i] << std::endl;
}
}
return 0;
}
高级用法:
判断两个字符串是否是字母异位词:
代码语言:javascript复制#include <iostream>
#include <string>
#include <algorithm>
bool isAnagram(std::string s1, std::string s2) {
if (s1.size() != s2.size()) return false;
int freq[26] = {0};
for(char ch : s1) {
freq[ch - 'a'] ;
}
for(char ch : s2) {
freq[ch - 'a']--;
}
for(int i = 0; i < 26; i) {
if (freq[i] != 0) return false;
}
return true;
}
int main() {
std::string s1 = "listen";
std::string s2 = "silent";
if (isAnagram(s1, s2)) {
std::cout << s1 << " and " << s2 << " are anagrams." << std::endl;
} else {
std::cout << s1 << " and " << s2 << " are not anagrams." << std::endl;
}
return 0;
}
4. 双指针(Sliding Window)技巧
概述:双指针技术通常用于处理数组或字符串中的子数组或子串问题。
实现:使用两个指针(左指针和右指针)来维护一个窗口,该窗口在数组或字符串中滑动,以寻找满足特定条件的子数组或子串。
特点:
- 高效:通过调整指针位置来动态维护窗口,减少不必要的计算。
- 灵活:可以用于解决多种问题,如最长子串、最短子串、子数组和等。
示例代码:
代码语言:javascript复制#include <vector>
#include <iostream>
int main() {
std::vector<int> nums = {1, 2, 3, 4, 5, 6};
int left = 0, right = 0, sum = 0, target = 10;
while(right < nums.size()) {
sum = nums[right ];
while(sum > target) {
sum -= nums[left ];
}
if(sum == target) {
std::cout << "Subarray found from index " << left << " to " << right - 1 << std::endl;
}
}
return 0;
}
高级用法:
找到所有和为给定值的子数组:
代码语言:javascript复制#include <vector>
#include <iostream>
std::vector<std::pair<int, int>> findAllSubarrays(std::vector<int>& nums, int target) {
std::vector<std::pair<int, int>> result;
int left = 0, right = 0, sum = 0;
while(right < nums.size()) {
sum = nums[right ];
while(sum > target) {
sum -= nums[left ];
}
if(sum == target) {
result.push_back({left, right - 1});
}
}
return result;
}
int main() {
std::vector<int> nums = {1, 2, 3, 4, 5, 6};
int target = 10;
std::vector<std::pair<int, int>> subarrays = findAllSubarrays(nums, target);
for(auto& p : subarrays) {
std::cout << "Subarray found from index " << p.first << " to " << p.second << std::endl;
}
return 0;
}
5. 成员函数与类
概述:类是 C 的基本面向对象编程(OOP)结构,用于封装数据和操作数据的方法。成员函数是类的函数,可以操作类的成员数据。
实现:
- 类定义:使用
class
关键字定义类,类中可以包含数据成员和成员函数。 - 成员函数:在类的内部定义的方法,可以操作类的成员变量。
- 访问控制:通过
public
,protected
,private
控制成员的访问权限。
特点:
- 封装性:将数据和操作封装在一起,提高代码的可维护性和可重用性。
- 继承性:类可以通过继承复用已有代码。
- 多态性:通过虚函数实现多态,提高代码的灵活性。
示例代码:
代码语言:javascript复制#include <iostream>
#include <vector>
#include <string>
class Solution {
public:
std::vector<int> findAnagrams(std::string s, std::string p) {
std::vector<int> ret;
int hash1[26] = { 0 };
for(auto ch : p) hash1[ch - 'a'] ;
int hash2[26] = { 0 };
int m = p.size();
for(int left = 0, right = 0, count = 0; right < s.size(); right ) {
char in = s[right];
if( hash2[in - 'a'] <= hash1[in - 'a']) count ;
if(right - left 1 > m) {
char out = s[left ];
if(hash2[out - 'a']-- <= hash1[out - 'a']) count--;
}
if(count == m) ret.push_back(left);
}
return ret;
}
};
int main() {
Solution solution;
std::string s = "cbaebabacd";
std::string p = "abc";
std::vector<int> result = solution.findAnagrams(s, p);
for(int index : result) {
std::cout << index << " ";
}
return 0;
}
高级用法:
类的继承:
代码语言:javascript复制#include <iostream>
class Base {
public:
void show() {
std::cout << "Base class" << std::endl;
}
};
class Derived : public Base {
public:
void show() {
std::cout << "Derived class" << std::endl;
}
};
int main() {
Base* basePtr;
Derived derived;
basePtr = &derived;
basePtr->show(); // 调用基类的 show 方法
derived.show(); // 调用派生类的 show 方法
return 0;
}
虚函数与多态:
代码语言:javascript复制#include <iostream>
class Base {
public:
virtual void show() {
std::cout << "Base class" << std::endl;
}
};
class Derived : public Base {
public:
void show() override {
std::cout << "Derived class" << std::endl;
}
};
int main() {
Base* basePtr;
Derived derived;
basePtr = &derived;
basePtr->show(); // 调用派生类的 show 方法,实现多态
return 0;
}