C++那些事之string_view

2022-12-02 20:43:23 浏览数 (1)

C 那些事之string_view

0.问题

string_view为c 17之后出现,其实就是leveldb中的slice,其目的在于解决内存拷贝、高效的substr。

但是,也引入了指针与引用的问题,由于string_view不拥有指向内容的所有权,对比于Rust,仅仅是借用,如果拥有内容的对象提前释放,便会出现悬挂引用问题。像Rust在编译时会分析变量的生命周期,保证借用的资源在使用时不会释放。然而C 没有检查,需要人工保证。

1.内部实现

string_view是一个basic_string_view类型,可以看到_Traits采用默认的char_traits,这个很重要,后面的一些函数都采用char_traits的一些成员函数执行核心操作。

代码语言:javascript复制
template<class _CharT, class _Traits = char_traits<_CharT> >
    class _LIBCPP_TEMPLATE_VIS basic_string_view;

typedef basic_string_view<char>     string_view;

basic_string_view内部成员:

代码语言:javascript复制
private:
    const   value_type* __data;
    size_type           __size;

构造兼容 string与const char*

代码语言:javascript复制
constexpr basic_string_view() noexcept;
constexpr basic_string_view(const basic_string_view&) noexcept = default;
basic_string_view& operator=(const basic_string_view&) noexcept = default;
template<class Allocator>
constexpr basic_string_view(const charT* str);
constexpr basic_string_view(const charT* str, size_type len);

迭代器支持:

代码语言:javascript复制
constexpr const_iterator begin() const noexcept;
constexpr const_iterator end() const noexcept;
constexpr const_iterator cbegin() const noexcept;
constexpr const_iterator cend() const noexcept;
const_reverse_iterator rbegin() const noexcept;
const_reverse_iterator rend() const noexcept;
const_reverse_iterator crbegin() const noexcept;
const_reverse_iterator crend() const noexcept;

其他核心函数:

  • substr
  • remove_prefix
  • compare
  • find
  • ...

从c 20开始支持starts_with、ends_with、contains,这三个在leveldb的slice中一开始就支持了。

char*的string_view字面量:

代码语言:javascript复制
constexpr basic_string_view<char>     operator "" sv( const char *str,     size_t len ) noexcept;
constexpr basic_string_view<wchar_t>  operator "" sv( const wchar_t *str,  size_t len ) noexcept;
constexpr basic_string_view<char16_t> operator "" sv( const char16_t *str, size_t len ) noexcept;
constexpr basic_string_view<char32_t> operator "" sv( const char32_t *str, size_t len ) noexcept;

2.使用陷阱

2.1

string_view不关心,会关心实际的字符个数。

代码语言:javascript复制
std::string_view s = "abcdef"sv;
std::cout << "s: " << s.size() << " "" << s << ""n";

输出:s: 8 "abcdef"

代码语言:javascript复制
std::string_view str{"hello", 1};
std::cout << str.data() << std::endl; // 输出 hello,而不是h

这里预期输出hello,但是却输出了h。

2.2 生命周期

代码语言:javascript复制
string_view foo() {
    std::string s{"hello world"};
    return string_view{s};
}

在该示例中,s出了作用域,string_view变成了悬空引用。

0 人点赞