C 语言中使用 strtok 函数

Jinku Hu 2023年1月30日 2021年2月7日
  1. 使用 strtok 函数对给定定界符的字符串进行标记化处理
  2. 使用 strtok_r 函数对带有两个定界符的字符串进行标记化
C 语言中使用 strtok 函数

本文将演示如何在 C 语言中使用 strtok 函数的多种方法。

使用 strtok 函数对给定定界符的字符串进行标记化处理

strtok 函数是 C 标准库的一部分,定义在 <string.h> 头文件中。它将给定的字符串分解成由指定定界符分割的标记。strtok 需要两个参数-第一个参数是指向要标记化的字符串的指针,第二个参数是定界符字符串。请注意,定界符字符串是作为一组字符来处理的,表示单独的定界符。函数返回指向一个空结束的字符串的指针,它代表下一个标记。不过要注意的是,当同一个字符串被多次调用 strtok 进行解析时,在第一次调用函数后,第一个指针参数必须是 NULL

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main(int argc, char *argv[])
{
    char *str1, *token;
    int j;

    if (argc != 3) {
        fprintf(stderr, "Usage: %s string delim\n",
                argv[0]);
        exit(EXIT_FAILURE);
    }

    for (j = 1, str1 = argv[1]; ; j++, str1 = NULL) {
        token = strtok(str1, argv[2]);
        if (token == NULL)
            break;
        printf("%d: %s\n", j, token);
    }

    exit(EXIT_SUCCESS);
}

示例命令:

./program "Temporary string to be parsed" " "

输出:

1: Temporary
2: string
3: to
4: be
5: parsed

使用 strtok_r 函数对带有两个定界符的字符串进行标记化

另外,还有另一个版本的函数,叫做 strtok_r,它是一个重入式变体,更适合多线程程序。这两个函数都会修改作为第一个参数传递的字符串,而且它们不能对常量字符串进行修改。下面的示例代码将给定的字符串 token 化为一个两层的层次结构。第一个层次由作为程序第二个参数传递的定界符上的标记组成。内部循环将每个标记从初始标记化中分割出来,最后,程序将结果输出到控制台。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main(int argc, char *argv[])
{
    char *str1, *str2, *token, *subtoken;
    char *saveptr1, *saveptr2;
    int j;

    if (argc != 4) {
        fprintf(stderr, "Usage: %s string delim subdelim\n",
                argv[0]);
        exit(EXIT_FAILURE);
    }

    for (j = 1, str1 = argv[1]; ; j++, str1 = NULL) {
        token = strtok_r(str1, argv[2], &saveptr1);
        if (token == NULL)
            break;
        printf("%d: %s\n", j, token);

        for (str2 = token; ; str2 = NULL) {
            subtoken = strtok_r(str2, argv[3], &saveptr2);
            if (subtoken == NULL)
                break;
            printf(" --> %s\n", subtoken);
        }
    }

    exit(EXIT_SUCCESS);
}

示例命令:

./program "Temporary string to be parsed" " " "aeio"

输出:

1: Temporary
 --> T
 --> mp
 --> r
 --> ry
2: string
 --> str
 --> ng
3: to
 --> t
4: be
 --> b
5: parsed
 --> p
 --> rs
 --> d
Author: Jinku Hu
Jinku Hu avatar Jinku Hu avatar

Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.

LinkedIn

相关文章 - C String