C语言中的字符串函数有如下这些

  • 获取字符串长度
    • strlen
  • 长度不受限制的字符串函数
    • strcpy
    • strcat
    • strcmp
  • 长度受限制的字符串函数
    • strncpy
    • strncat
    • strncmp
  • 字符串查找
    • strstr
    • strtok
  • 错误信息报告
    • strerror

字符串查找

strstr

还是一样,先看看如何使用它,对吧哈哈哈。

int main() 
{
	char* p1 = "abcdef";
	char* p2 = "def";
	// 在abcdef中找找def,找到的话返回它的地址,找不到返回空指针
	char* rest = strstr(p1, p2);
	if (rest == NULL) 
	{
		printf("子串不存在\n");
	}
	else 
	{
		printf("%s\n", rest);
	}

	return 0;
}

老规矩,我们还是看看文档是怎样说的,如下

strstr文档

char * strstr ( const char * str1, const char * str2 );

Returns a pointer to the first occurrence of str2 in str1, or a null pointer if str2 is not part of str1.

返回一个指针,它指向str2,该str2是在str1中第一次出现的str2,或者一个空指针,如果str2不是str1的子串。

The matching process does not include the terminating null-characters, but it stops there.

这个匹配过程不包含’\0’,但是它会停在那里。

实现

我们需要想想,它是如何实现字符串查找的?

有两个字符串,str1和str2,在str1中查找str2,那么我们需要两个指针p1p2来进行,p1指向str1开头,p2指向str2开头,然后获取字符一一比较。

如果*p2'\0'那么说明str2是空字符串,不能进行比较,就返回p1,即返回str1的地址。

如果*p2不为'\0',就说明不是空字符串,同时,也要判断*p1是否为空字符串,不是就可以进行查找。

查找的话,此时,我就通过*p1 == *p2判断*p1等于*p2?等于就都进行偏移,即p1++p2++,然后继续判断,这里就成了一个循环,一直循环,直到它们两个不相等跳出循环。跳出循环后,如果*p2 等于'\0',说明已经查找到了,直接返回p2就好。如果*p2 不等于'\0',那么就p1就进行偏移,往后移动,继续判断,这里也形成了一个循环。到这里,基本的逻辑就这样了。

下面看看代码的实现。

断言指针不为空是个好习惯~

char* my_strstr(const char* p1, const char* p2) 
{
	// 保证指针的有效性,所以assert
	assert(p1 != NULL);
	assert(p2 != NULL);
	// 如果p2是空字符串,那就比不了
	if (*p2 == '\0') 
	{
		printf("空字符串比不了,返回p1");
		return p1;
	}
	// 真正的查找实现
	while (*p1) // 判断*p1是'\0'吗?不是就可以查找
	{
		//while (*p1 == *p2)	// 判断*p1等于*p2?等于就都进行偏移
		while ((*p1 != '\0') && (*p2 != '\0') && (*p1 == *p2) )	// 继续完善,*p1,*p2都不能是\0,遇到\0就结束了,没东西可比了
		{
			p1++;
			p2++;
		}
		if (*p2 == '\0') 
		{
			// 说明匹配到了
			return p2;
		}
		p1++;	// 不等于,那么p1往后偏移
	}
}

是的,到这里还没有结束,上面看似可以进行匹配了,但是代码还是有问题,比如遇到这种情况的时候

int mian()
{
    char* p1 = "abbbcdef";
    char* p2 = "bbc";
    char* rest = my_strstr(p1, p2);
    return 0;
}

第一个字符串的第一个字符a与第二个字符串的第一个字符b进行比较,发现不相等,那么p1就进行偏移,p1往后移动

此时b与b相比,相等,那么p1和p2都进行偏移,都往后移动

还是b与b相比,相等,继续偏移

此时b与c相比,不相等,那么p1进行偏移,此时p1指向的就是第五个字符c了,后面继续比较下去,肯定都不相等,也就是说找不到bbc,但是第一个字符串里明明有bbc,就是找不到,这就是会出现的问题。

那如何解决这个问题?

我们知道,如果可以让p1重新回去第二个字符的位置开始比较,那么肯定就能够找到bbc,但是上面的代码中,使p1发生改变了,p1不知道第二个字符b的位置,直接从第五个字符c的位置开始了。

所以,要解决的话,我们就需要一个变量记录从哪个位置开始匹配的,然后我们不要去改动p1,同时保险起见,也不要改动p2,那么我们就可以搞多两个指针变量s1s2,作为p1p2的拷贝,对这两个变量进行操作,就OK了~然后搞多一个变量current,作为当前需要移动的指针。

char* my_strstr(const char* p1, const char* p2)
{
	// 保证指针的有效性,所以assert
	assert(p1 != NULL);
	assert(p2 != NULL);
	// p1,p2不要往后动
	// 需要一个变量记录从哪个位置开始匹配
	//char* s1 = p1;	// 这里赋值无所谓,就给NULL好了
	char* s1 = NULL;
	char* s2 = NULL;
	char* current = (char*)p1;	// 这里强制类型转换,因为p1是const修饰,赋值给了char*这个没有保护的,所以强转下,不然会报警告
	// 如果p2是空字符串,那就比不了
	if (*p2 == '\0')
	{
		printf("空字符串比不了,返回p1");
		return (char*)p1;
	}
	// 真正的查找实现
	while (*current) // 判断*current是'\0'吗?不是就可以查找
	{
		s1 = current;
		s2 = (char*)p2;
	
		while ((*s1 != '\0') && (*s2 != '\0') && (*s1 == *s2))
		{
			s1++;
			s2++;
		}
		if (*s2 == '\0')
		{
			// 说明匹配到了
			return current;	// 返回子串地址
		}
		if (*s1 == '\0') 
		{
			// 如果子串比较长,那么肯定是找不到的
			return NULL;
		}
		current++;	// 不等于,那么current往后偏移
	}
	return NULL;	//找不到子串
}