带你玩转字符串
1.strlen函数不一样的细节
1.1模拟实现strlen函数
2.strcpy函数的巧妙
2.2strcpy的模拟实现
3.strcmp函数的巧妙
3.2strcmp的模拟实现
首先了解strlen 函数的参数
size_t strlen ( const char * str );
size_t 是什么东西呢?
看下面的操作:

这里介绍一个快捷键,输入size_t后,按住ctrl + 鼠标左键,即可转到定义,或者右击鼠标,点击转到定义即可
所以 size_t == unsigned int ,strlen 的返回类型是无符号类型
注意这里,这是无符号整型!下面的介绍大有用处
下面介绍strlen 的用法:
strlen是一个库函数,它会顺着你 传过来的地址,一直往下找,直到找到\0为止,返回的是无符号整型

输出结果为6
再看下面的代码:

结果还是6吗,不再是6了,而是一个随机值。字符串这样放在数组里,没有\0,所以strlen会顺着arr不断往下找,什么时候找到\0,我们不得而知。
这证实strlen是顺着地址往下找的。
int my_strlen(const char* str)
{ //const修饰的内容无法更改int count = 0;assert(str != NULL);while (*str) {count++;str++;}return count;
}int main()
{int len = my_strlen("abcdef");printf("%d\n", len);return 0;
}
打印出来的结果仍然是6,这里要讲的重点不是如何实现strlen函数。
细心的你会发现:
strlen 函数的返回值不应该是size_t 吗,为什么上面写的是 my_strlen 是 int 类型呢?
是因为: 其实这两种写法都可以,各有利弊:
先看下面的一段代码:
int main()
{if (strlen("abc") - strlen("abcdef") > 0)注意这里是库函数的strlen{printf("hehe\n");}else{printf("haha\n");}return 0;
}
请说出上面代码的输出结果:
没注意到细节,一定会说出会打印haha,运行出真知:

为什么呢?
回到上面的strlen的返回类型,size_t,是 unsigned int ,无符号整型,abc的长度是3,abcdef长度是6,那么3-6 == -3 ,-3作为 unsigned int 类型,是一个大于0的数,
打印结果如下图:

是一个大于0的数,所以会打印hehe,
假如是用自己的my_strlen 函数,结果如下:

这就很符合我们的认知, 3 - 6 == -3 <0,走else 语句。
不过,这两种写法,各有各的好处,假如你想跟着标准走的话,写size_t是绝对没有问题的,因为计算长度是不可能有负数的。
但是写 int 类型,也没有什么问题,单独计算一个字符串的长度时,返回值也是一个大于0的数,当3 - 6 == -3时,的确是会走if 语句,更符合我们的理解,不容易产生歧义。
所以两种写法各有利弊。
注意事项:

先看库函数的声明:
char * strcpy ( char * destination, const char * source );目的地 源头
需要两个地址,一个是目的地地址,一个是源头地址
举个例子:
int main()
{char arr1[] = "abcdef";char arr2[] = "hello";strcpy(arr1, arr2);将arr2字符串拷贝到arr1printf("%s\n", arr1);}
运行结果如下:

下面来模拟实现:
char* my_strcpy(char* dest, char* src)
{assert(dest && src);char* ret = dest;while (*src!='\0'){*dest = *src;dest++;src++;}*dest = *src;//循环结束后,src指向了\0的位置,所以将\0也赋值给dest;return ret;
}int main()
{char arr1[] = "abcdef";char arr2[] = "hello";char *ret = my_strcpy(arr1, arr2);printf("%s\n", ret);
}
特殊位置已注释讲解 ,但是你会发现,模拟代码还可以精简化
char* my_strcpy(char* dest, const char* src)目标空间必须可变,源头空间不可变
{assert(dest && src); 判断指针的有效性char* ret = dest;while (*dest++ = *src++);return ret ;
}
每次src对应的字符赋值给dest后,再++,dest也++,然后进行判断,如果为\0 , \0的ascii码值为0,while为0,退出循环
这样的代码才是,满分代码
strcpy注意事项:

char arr1[] = { 'a','b','c','d','e','f' };错误代码:字符串无\0char arr1 = "abcdef";错误代码:常量字符串无法更改

请注意第三点:目标空间必须足够大。
这是因为strcpy这个函数,它只管拷贝,只管找到\0才停止,它才不管你的空间够不够,这就是strcpy函数的脾气,所以必须充分了解。
首先了解函数的声明:
int strcmp ( const char * str1, const char * str2 );
strcmp的参数是两个不可更改的char*的指针
返回值:当第一个字符串大于第二个时,返回一个大于0的数,当第一个字符串小于第二个时,返回小于0的数,等于时,返回0
测试一下结果:

但是这里,在visual studio环境下,返回值只是-1,0,1,是不是说这个strcmp函数有问题呢?其实并不是,当我们模拟实现的时候就能够发现。
下面来模拟实现strcmp函数:
int my_strcmp(const char* str1, const char* str2)
{assert(str1 && str2);while (*str1 == *str2){if (*str1 == '\0'){return 0;//相等的情况}str1++;str2++;}return (*str1 - *str2);//不相等的情况
}int main()
{char* p1 = "abcdef";char* p2 = "sqwer";int ret = my_strcmp(p1,p2);printf("%d", ret);return 0;
}
可以看到,a和s相比,相差了18,a的ascii码值是97,s的ascii码值是115,两者相减,结果就是-18,所以p1 小于 p2

这是一个追加函数,意思是在原字符串的末尾,继续追加其他字符串。
char * strcat ( char * destination, const char * source );
该函数的声明如上:
参数是两个指针,一个是目的地指针,一个是源头指针。
返回类型是目的地起始地址。
int main()
{char arr1[30] = "hello";char arr2[] = "world";strcat(arr1, arr2);printf("%s\n", arr1);
来看一下strcat函数的实现过程,
在arr1之后追加了arr2.
但是会不会连world末尾的\0也追加上去呢?
答案是会的:

可知,world后面连\0也追加上去了;
那么能不能自己追加自己?
可以看到,程序崩溃了

原因究竟是什么?
调试之后我们发现,arr1没有\0了!,hello未被追加时,后面还有一个\0,但是追加之后,arr2是从\0开始追加的,所以当我们追加之后,\0已经被覆盖了。所以它会无限追加下去。所以这个程序就崩溃了。
char* my_strcat(char* dest, const char* src)
{assert(dest && src);char* ret = dest;//1.找到目的字符串的\0位置while (*dest!='\0'){dest++;}//2.追加的过程其实就是拷贝的过程while (*dest++ = *src++){;}return ret;
}
int main()
{char arr1[30] = "hello";char arr2[] = "world";my_strcat(arr1, arr2);printf("%s\n", arr1);
}
重点部分已经作了注释:
不过有几点要注意一下:

与strlen相似,如果源字符串后无\0,这就像自己追加自己,导致程序崩溃
如下图:

arr1的只有6个大小的空间,如果强制追加arr2上去,就会导致程序崩溃。
当源头字符串后面没有\0时,会出现:

追加过去之后,但是后面没有\0,就没有\0追加,无结束标志,程序会崩溃。
如果对你有帮助的话,就关注一下吧!