> 文章列表 > 详解C语言string.h中常见的14个库函数(三)

详解C语言string.h中常见的14个库函数(三)

详解C语言string.h中常见的14个库函数(三)

详解C语言string.h中常见的14个库函数(三)
本篇博客继续讲解C语言string.h头文件中的库函数。本篇博客计划讲解3个函数,分别是:strstr, strtok, strerror。其中strstr函数我会用一种最简单的方式模拟实现。

strstr

char * strstr ( const char * str1, const char * str2 );

strstr可以在str1中查找str2第一次出现的位置,并且返回一个指针指向该位置。如果找不到,就返回NULL指针。

比如:

#include <stdio.h>
#include <string.h>int main()
{char arr1[] = "abcccccdecccdefg";char arr2[] = "cccd";char* ret = strstr(arr1, arr2);if (ret == NULL)printf("找不到\\n");elseprintf("%s\\n", ret);return 0;
}

输出结果:
详解C语言string.h中常见的14个库函数(三)
由于返回了cccd第一次出现的位置,顺着该地址往后打印,就有了以上的结果。

这个函数的使用是非常简单的,它的难点在于如何实现。有一些比较复杂的算法,比如KMP算法,可以实现类似的功能,但是难度较大,不适合初学者,这里我使用一种暴力查找的思路来实现。

首先,搭出框架:

char* my_strstr(const char* str1, const char* str2)
{assert(str1 && str2);const char* cp = str1;while (*cp){cp++;}
}

我的想法是,先用cp指针,指向str1的位置,然后使用该指针向后遍历str1这个字符串,看看能不能找到str2,如果找到了就返回cp指针。那每次如何查找呢?可以再定义2个指针s1和s2,s1从cp的位置向后遍历,s2从str2的位置向后遍历。

char* my_strstr(const char* str1, const char* str2)
{assert(str1 && str2);const char* cp = str1;const char* s1 = str1;const char* s2 = str2;while (*cp){s1 = cp;s2 = str2;cp++;}
}

s1和s2指向的字符,如果相等,就遍历下一对,如果s2遇到了\\0,就说明找到了。

char* my_strstr(const char* str1, const char* str2)
{assert(str1 && str2);const char* cp = str1;const char* s1 = str1;const char* s2 = str2;while (*cp){s1 = cp;s2 = str2;while (*s1 && *s2 && *s1 == *s2){++s1;++s2;}if (*s2 == '\\0'){return (char*)cp;}cp++;}return NULL;
}

strtok

char * strtok ( char * str, const char * sep );

strtok这个函数较为复杂,想要理解并且灵活使用,需要理解以下几点:

  1. strtok是用来分割字符串的。有些时候,我们想根据某些分隔符来分割一个字符串,就可以使用strtok。比如:"fish@qq.com",如果我们想根据@.这2个分隔符来分割该字符串,就可以分割成3个字符串,分别是:fish, qq, com
  2. strtok的第1个参数是待分割的字符串。第2个参数是分隔符的集合,即分隔符(一些字符)组合成的字符串。比如,如果我们想用@.来分割fish@qq.com这个字符串(假设把这个字符串存储到了字符数组arr中char arr[] = "fish@qq.com";),可以这么写:char* ret = strtok(arr, "@.");。其中"@."是由1个或多个分隔符组成的字符串。
  3. 如果“正常”调用该函数,即使用第2点的方式,strtok函数会找到字符串中的第1个分隔符出现的地方,把这个分隔符改成\\0,并且返回由该分隔符分割的字符串(这个字符串在分隔符前面)。这么说有点抽象,以第2点的例子为例,strtok会在arr中找到第一个@,把@改成\\0,此时arr数组存储的就是:"fish\\0qq.com",函数会返回f的地址,此时如果使用printf以%s的格式打印这个返回的地址printf("%s\\n", ret);就会打印出fish。
  4. 如果调用该函数时,第一个参数为NULL指针,函数会从同一个字符串上次查找到的分隔符的位置开始向后找,找到下一个分隔符,然后返回以该分隔符分割的字符串(这个字符串在分隔符前面)。比如,假设已经像第2、3点所示调用过一次strtok函数了,如果再这么调用:ret = strtok(NULL, "@.");,函数就会找到.所在的位置,并把.改成\\0,此时arr中存储的就是:"fish\\0qq\\0com",函数会返回第一个q的地址,此时以同样的方式printf("%s\\n", ret);打印这个返回值,就会打印qq。同理,再调用一次ret = strtok(NULL, "@.");,然后再打印printf("%s\\n", ret);就会打印出com。
  5. 如果函数没有找到下一个标记,就会返回NULL指针。

所以,根据以上知识点,如果我想要分割一个字符串"hello@world.nihao-shijie@this+is@a.test",可以使用一个循环来搞定。注意,一般来说,我们都会先把这个字符串拷贝一份,再来做分割,因为strtok函数会改变原字符串。

#include <stdio.h>
#include <string.h>int main()
{char arr[] = "hello@world.nihao-shijie@this+is@a.test";char bak[100] = { 0 };strcpy(bak, arr);const char* sep = "@.+-";char* ret = strtok(arr, sep);while (ret){printf("%s\\n", ret);ret = strtok(NULL, sep);}return 0;
}

只有第一次调用是“正常”调用,其他每次调用第一个参数都传NULL指针,这样就会从上次找到的位置接着向后找。哪次没有找到就会返回NULL指针,跳出循环。

输出结果:
详解C语言string.h中常见的14个库函数(三)

strerror

char * strerror ( int errnum );

strerror函数会返回错误码对应的错误信息。使用起来非常简单,比如我强行制造一个错误,让malloc函数开辟很大一块空间。当然,strerror智能检测库函数调用时的错误。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <errno.h>int main()
{size_t n = -1; // 制造一个很大的数int* p = (int*)malloc(n);if (p == NULL){printf("malloc: %s\\n", strerror(errno));return 1;}// ...free(p);p = NULL;return 0;
}

详解C语言string.h中常见的14个库函数(三)

可以发现,malloc函数开辟空间失败时,使用strerror,把错误码errno转换成了一个字符串,并且返回这个字符串的起始位置。顺着这个位置打印,就打印出了错误信息:“Not enough space”。

errno是一个全局变量,如果库函数调用失败,就会设置错误码,而strerror就可以把该错误码转换成错误信息。注意,errno的使用需要引用头文件errno.h。

当然,如果只想打印错误信息,可以直接使用perror函数,比如以上程序就可以把printf("malloc: %s\\n", strerror(errno));换成perror("malloc");。各位可以自行验证,以上2句代码是完全等价的。

总结

  1. strstr函数可以在一个字符串中查找子串,如果找到,就返回第一次出现的位置;如果找不到返回NULL指针。
  2. strtok函数可以分割一个字符串。如果“正常”调用,即第一个参数不为NULL,就会去找分隔符第一次出现的位置;如果第一个参数为NULL,就会从上一次找到的位置开始向后找。
  3. strerror可以把错误码转换成错误信息。当库函数调用出现错误时,编译器会把错误码保存到errno这个全局变量中,而strerror可以把errno对应的错误码转换成错误信息。

感谢大家的阅读!