[C++] 深入浅出list容器

list介绍

列表是序列容器，允许在序列中的任何位置进行恒定时间插入和擦除操作，以及双向迭代。该容器用双向链表实现。

list接口的使用

构造函数

构造函数	接口说明
list(size_type n, const value_type& val = value_type())	构造的list中包含n个值为val的元素
list()	构造空的list
list(const list& x)	拷贝构造函数
list(InputIterator first, InputIterator last)	用[first, last)区间中的元素构造

`iterator`迭代器

函数声明	接口说明
begin	返回第一个元素的迭代器
end	返回最后一个元素下一个位置的迭代器
rbegin	返回第一个元素的reverse_iterator，即end位置

begin与end为正向迭代器，对迭代器执行操作，迭代器向后移动
rbegin(end)与rend(begin)为反向迭代器，对迭代器执行操作，迭代器向前移动

`capacity`

函数声明	接口说明
empty()	检测list是否为空，如果是返回true，否则返回false
size()	返回list中有效节点的个数

element access

函数声明	接口说明
front()	返回list的第一个节点中值的引用
back()	返回list的最后一个节点中值的引用

modifiers

函数声明	接口说明
push_front(val)	在list首元素前插入值为val的元素
pop_front()	删除list中第一个元素
push_back(val)	在list尾部插入值为val的元素
pop_back()	删除list中最后一个元素
insert(position, val)	在list的position位置插入值为val的元素
erase(position)	删除list的position位置的元素
swap(list)	交换两个list中的元素
clear()	清空list中的有效元素

`list`中的迭代器失效问题

list的erase()操作可能会使迭代器失效。

因为list的底层结构是双向带头循环链表，所以在list中进行insert操作的时候不会导致迭代器失效，只有在删除的时候才会失效，而且失效的知识指向被删除节点的迭代器，其他迭代器不会受影响。

代码语言：javascript复制

// erase 模拟实现
iterator erase(iterator pos)
{
	assert(pos != end());

	Node* prev = pos._node->_prev;
	Node* next = pos._node->_next;

	prev->_next = next;
	next->_prev = prev;
	delete pos._node;

	--_size;

	return next;
}

代码语言：javascript复制

it = lt.begin();
while (it != lt.end())
{
	if (*it % 2 == 0)
	{
		it = lt.erase(it);
	}
	else
	{
		  it;
	}
}

根据官方文档所述，erase会用迭代器作为返回值，返回删除的迭代器的下一个位置的迭代器。所以在删除后可以更新迭代器，保证迭代器不会失效。

常见容器及其迭代器类型特性

单向迭代器（Forward Iterator）

功能：只能向前遍历容器中的元素。
容器：std::forward_list, std::unordered_map, std::unordered_set, std::unordered_multimap, std::unordered_multiset

代码语言：javascript复制

std::forward_list<int> fl = {1, 2, 3};
auto it = fl.begin(); // it 是单向迭代器
while (it != fl.end()) 
{
    // 可以递增 it
      it;
}

双向迭代器（Bidirectional Iterator）

功能：可以向前和向后遍历容器中的元素。
容器：std::list, std::map, std::set, std::multimap, std::multiset

代码语言：javascript复制

std::list<int> lst = {1, 2, 3};
auto it = lst.begin();
// 可以递增和递减 it
  it; // 向前
--it; // 向后

随机访问迭代器（Random Access Iterator）

功能：提供对元素的随机访问能力，可以进行快速的非连续访问。
容器：std::vector, std::string, std::deque, std::array

代码语言：javascript复制

std::vector<int> vec = {1, 2, 3, 4, 5};
auto it = vec.begin()   2; // 直接跳到第三个元素
--it; // 递减
vec.end() - 1; // 指向最后一个元素

常见迭代器

const_iterator

功能：只读迭代器，不能用来修改容器中的元素。
适用性：所有容器都提供了 const_iterator 类型。

reverse_iterator

功能：反向迭代器，允许从容器的末尾向前遍历元素。
适用性：提供双向或随机访问迭代器的容器。

const_reverse_iterator

功能：只读反向迭代器，不能用来修改容器中的元素。
适用性：提供双向或随机访问迭代器的容器。

代码语言：javascript复制

std::vector<int> vec = {1, 2, 3, 4, 5};
auto it = vec.begin(); // 随机访问迭代器

// 随机访问迭代器的操作
it  = 2; // 跳到第三个元素
*it -= 1; // 修改元素

// 反向迭代器
auto rit = vec.rbegin(); // reverse_iterator
  rit; // 向前（实际上是向后元素的方向）

模拟实现`list`时的问题

模版多参数传参与按需实例化

在实现iterator和const_iterator时，为了避免两个类模板代码的冗余和相似性高，可以通过控制模版的传参，利用按需实例化来进行书写该模拟实现部分。

模板多参数传递

list_iterator 模板有三个类型参数：

T - 表示链表中存储的数据类型。
Ref - 表示对数据类型的引用类型，通常为 T& 或 const T&。
Ptr - 表示指向数据类型的指针类型，通常为 T* 或 const T*。

这些参数允许用户根据需要定制迭代器的行为，例如是否允许修改数据（通过 Ref）或者返回常量或非常量指针（通过 Ptr），由此可以实例化出list_iterator和const_list_iterator。

按需实例化

模板类或函数在实际使用时才被编译器实例化。这意味着只有当用户显式地创建一个特定类型的模板实例时，编译器才会生成相应的代码。

代码语言：javascript复制

typedef list_iterator<T, T&, T*> iterator;
typedef list_iterator<T, const T&, const T*> const_iterator;

例如通过传递不同的参数来进行实例化出list_iterator和const_list_iterator。

`list`的排序

list为双向链表，std::algorithm::sort()排序要求的是随机迭代器，而list为双向迭代器，所以无法直接使用算法库的sort()进行排序。

[C ] vector入门&迭代器失效问题详解-CSDN博客

在以上文章里有提及关于对于排序效率低的容器的排序方法。

对于list的排序可以使用vector拷贝list内的数据，排序后再重新数据按顺序拷贝会list。

代码语言：javascript复制

vector<int> v(lt2.begin(), lt2.end());

// 排序
sort(v.begin(), v.end());

// 拷贝回lt2
lt2.assign(v.begin(), v.end());

vector的排序不仅解决了list的排序问题，还使排序更加高效。

`emplace_back`与`push_back`

emplace_back 和 push_back 都是 C STL 容器（如 vector、deque、list 等）中用来在容器的末尾添加元素的方法。它们的主要区别在于元素的构造方式和性能。

`push_back`

功能：将一个元素的副本或移动到容器的末尾。
使用方式：

代码语言：javascript复制

std::vector<int> vec;
vec.push_back(10);  // 将10的副本添加到容器末尾

构造方式：先在容器末尾分配空间，然后将元素复制或移动到新位置。
优点：
- 简单易用，适用于任何类型的元素。
- 可以添加一个已经存在的元素的副本或移动版本。

`emplace_back`

功能：在容器末尾就地构造一个元素。
使用方式：

代码语言：javascript复制

std::vector<std::pair<int, int>> vec;
vec.emplace_back(10, 20);  // 直接在容器末尾构造一个pair<int, int>

构造方式：直接在容器末尾的空间内构造元素，不需要先复制或移动。
优点：
- 避免了不必要的复制或移动操作，特别是在构造复杂对象时，可以显著提高性能。
- 可以直接传递构造参数，方便构造复杂类型。
- 避免了临时对象的创建，减少了内存使用。

性能比较

push_back：如果元素类型是简单的类型（如 int、float 等），复制操作对性能的影响不大。但如果元素类型是复杂的类型（如自定义类），复制操作可能会影响性能。
emplace_back：对于复杂类型，使用 emplace_back 可以避免复制或移动操作，直接在容器末尾构造元素，从而提高性能。

使用场景

push_back：当你需要添加一个已经存在的元素的副本或移动版本时，使用 push_back。
emplace_back：当你需要构造一个新元素，并且这个元素的构造过程复杂或需要传递多个参数时，使用 emplace_back。

举例

代码语言：javascript复制

list<A> lt;
A aa1(1, 1);
lt.push_back(aa1);
lt.push_back(A(2, 2));
//lt.push_back(3, 3);

lt.emplace_back(aa1);
lt.emplace_back(A(2, 2));
cout << endl;
// 支持直接传构造A对象的参数emplace_back
lt.emplace_back(3, 3);

设置打印信息，运行如下：

可以发现，在使用emplace_back(3, 3)的时候会直接进行构造，而不会像使用push_back一样先构造出一个对象，再拷贝构造进行插入。

push_back()执行的时候需要一个现有的元素或者隐式的构造一个元素再拷贝到插入的空间。

emplace_back 通常在需要构造复杂类型或避免不必要的复制和移动操作时更优，而 push_back 在添加简单类型或已经存在的元素时更为方便。

通过重载再次理解`->`与`.`

->与.操作符都是用来访问对象的成员，但是使用的前提不同。

`.` 操作符

.操作符用于直接访问对象实例的成员。它需要一个对象实例或结构体，而不是指针。

代码语言：javascript复制

struct MyStruct {
    int x;
    int y;
};

MyStruct obj;
obj.x = 10; // 通过 . 访问成员

obj是一个结构体或类的对象，通过obj.x直接访问其成员x。

`->` 操作符

->操作符用于通过指针访问对象的成员。它的功能实际上是先解引用指针，然后访问成员。

代码语言：javascript复制

struct MyStruct {
    int x;
    int y;
};

MyStruct* p = new MyStruct();
p->x = 10; // 通过 -> 访问成员

p是一个指向结构体或类的指针，通过p->x访问指针指向对象的成员x。p->x等同于(*p).x，即先解引用指针，再访问成员。

主要区别

操作对象类型：
. 操作符作用于对象的实例。
-> 操作符作用于对象的指针。
使用场景：
当你有一个对象实例时，使用.来访问成员。
当你有一个对象的指针时，使用->来访问成员。
底层实现：
. 直接访问对象的成员，不涉及解引用。
**->**** 隐式地解引用指针，然后访问成员。**

`operator*()`

代码语言：javascript复制

Ref operator*()
{
    return _node->_data;
}

这个函数返回当前节点数据的引用（Ref），即_node->_data。
当你使用*ita时，它会调用operator*()，返回迭代器指向的数据。

`operator->()`

代码语言：javascript复制

Ptr operator->()
{
    return &_node->_data;
}

这个函数返回指向当前节点数据的指针（Ptr），即&_node->_data。
当你使用ita->时，它会调用operator->()，返回数据的指针，从而访问数据的成员。

`operator->()`的实际使用

代码语言：javascript复制

while (ita != lta.end())
{
    cout << ita->_a1 << ":" << ita->_a2 << endl;
    cout << ita.operator->()->_a1 << ":" << ita.operator->()->_a2 << endl;

      ita;
}

**ita->_a1**和**ita->_a2**：
由于operator->()返回了指向_node->_data的指针，所以ita->_a1等价于(*ita)._a1。
通过重载operator->()，用简化了的语法，使得ita->_a1这种写法成为可能，而不需要显式地写成(*ita)._a1或ita.operator->()->_a1。这使得代码更具可读性和直观性，尤其是在访问嵌套结构或类成员时。
**ita.operator->()->_a1**和**ita.operator->()->_a2**：
这是显式调用operator->()，获取指向数据的指针，然后访问其成员。
这种写法展示了运算符重载的具体调用过程。

模拟实现`list`框架

整体模拟实现list的框架如图，将迭代器与节点包装成类模板进行使用：

指针 c++ 容器 list 对象

0 人点赞

[C++] 深入浅出list容器

list介绍

list接口的使用

构造函数

iterator迭代器

capacity

element access

modifiers

list中的迭代器失效问题

常见容器及其迭代器类型特性

单向迭代器（Forward Iterator）

双向迭代器（Bidirectional Iterator）

随机访问迭代器（Random Access Iterator）

常见迭代器

const_iterator

reverse_iterator

const_reverse_iterator

模拟实现list时的问题

模版多参数传参与按需实例化

模板多参数传递

按需实例化

list的排序

emplace_back与push_back

push_back

emplace_back

性能比较

使用场景

举例

通过重载再次理解->与.

. 操作符

-> 操作符

主要区别

operator*()

operator->()

operator->()的实际使用

模拟实现list框架

`iterator`迭代器

`capacity`

`list`中的迭代器失效问题

模拟实现`list`时的问题

`list`的排序

`emplace_back`与`push_back`

`push_back`

`emplace_back`

通过重载再次理解`->`与`.`

`.` 操作符

`->` 操作符

`operator*()`

`operator->()`

`operator->()`的实际使用

模拟实现`list`框架