C++ 中字符串的 sizeof 运算符和 strlen 函数的区别

Jinku Hu 2023年1月30日 2021年10月2日
  1. sizeof 运算符特征和使用场景
  2. 使用 std::string::size 成员函数检索字符串中的字符数
C++ 中字符串的 sizeof 运算符和 strlen 函数的区别

本文将演示在 C++ 中使用 sizeof 运算符而不是 strlen 函数处理字符串时的多个差异。

sizeof 运算符特征和使用场景

sizeof 运算符是一个一元运算符,用于检索给定表达式或数据类型的存储大小。此运算符以字节为单位评估对象大小,并且 sizeof(char) 保证为 1

有一种误解,认为 1 字节总是等于 8 位,因此,我们可以以位为单位计算对象的大小。实际上,语言本身并不能保证一个字节是 8 位。它主要取决于底层硬件平台。尽管如此,大多数当代通用硬件仍使用 8 位字节。

请注意,sizeof 运算符不能应用于包含函数或不完整类型或位域的表达式。在以下示例代码中,我们将 sizeof 运算符应用于两个不同类型的数组,结果在你的平台上也可能相同。由于 char 保证有 1 个字节的大小,20 个字符的数组将占用 20 个字节。

另一方面,long long 数据类型是实现定义的,在这种情况下,它恰好是 8 个字节。因此,总数组大小为 160 字节。请注意,我们还可以通过将 sizeof 整个数组除以 sizeof 一个元素来找到数组中的元素数,如下一个示例的最后几行所示。

#include <iostream>

using std::cout;
using std::endl;

int main(){
    char arr[20];
    long long arr2[20];

    cout << "sizeof ( array of 20 long longs ) : " << sizeof arr << endl;
    cout << "sizeof ( array of 20 long longs ) : " << sizeof arr2 << endl;
    cout << "length of array of 20 chars)      : " << ((sizeof arr) / (sizeof arr[0])) << endl;
    cout << "length of array of 20 long longs ): " << ((sizeof arr2) / (sizeof arr2[0])) << endl;

    return EXIT_SUCCESS;
}

输出:

sizeof ( array of 20 long longs ) : 20
sizeof ( array of 20 long longs ) : 160
length of array of 20 chars)      : 20
length of array of 20 long longs ): 20

使用 sizeof 运算符来查找字符串的长度是错误的。让我们考虑 C++ 中字符串的两种表示类型,一个字符串和一个 std::string 类。前一个主要使用 char 指针访问,在其上应用 sizeof 将检索指针本身的存储大小,而不是整个字符串。

如果我们尝试使用 sizeof 运算符检索 std::string 对象的大小,我们将获得对象的存储大小,这将不是字符串中的字符数,如下面的代码片段所示。

#include <iostream>
#include <string>
#include <cstring>

using std::cout;
using std::endl;
using std::string;

int main(){
    const char *text1 = "arbitrary string value 1";
    string text2 = "arbitrary string value 2";

    cout << "sizeof char* : " << sizeof text1 << endl;
    cout << "sizeof string: " << sizeof text2 << endl;
    cout << "sizeof string.data: " << sizeof text2.data() << endl;

    return EXIT_SUCCESS;
}

输出:

sizeof char* : 8
sizeof string: 32
sizeof string.data: 8

然后我们得到了 strlen 函数,它是 C 字符串库的残余。它计算给定字符串的长度,函数返回字节数作为整数值。strlen 可以应用于存储有效字符串的 char 指针或 std::string::c_str 返回的值,但它不应该是 C++ 程序员的选择。

#include <iostream>
#include <string>
#include <cstring>

using std::cout;
using std::endl;
using std::string;

int main(){
    const char *text1 = "arbitrary string value 1";
    string text2 = "arbitrary string value 2";

    cout << "strlen char* : " << strlen(text1) << endl;
    cout << "strlen string: " << strlen(text2.c_str()) << endl;

    return EXIT_SUCCESS;
}

输出:

strlen char* : 24
strlen string: 24

使用 std::string::size 成员函数检索字符串中的字符数

相反,C++ 程序员应该利用 std::string 类的 size 成员函数,因为它提供了一种更安全的处理字符串的方法。请注意,如果我们有一个字符串,我们甚至可以使用 size 成员函数。我们需要构造一个新的 string 对象并直接对返回值调用 size 函数。以下代码示例显示了这两种方案的主要用途。

#include <iostream>
#include <string>
#include <cstring>

using std::cout;
using std::endl;
using std::string;

int main(){
    const char *text1 = "arbitrary string value 1";
    string text2 = "arbitrary string value 2";

    cout << "length char* : " << string(text1).size() << endl;
    cout << "length string: " << text2.size() << endl;

    return EXIT_SUCCESS;
}

输出:

length char* : 24
length string: 24
Author: Jinku Hu
Jinku Hu avatar Jinku Hu avatar

Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.

LinkedIn

相关文章 - C++ String