Linux C编程学习6---字符串处理、数据转换
1.字符串
应用程序按其功能可分为数值计算、非数值计算以及输入输出操作等。非数值计算程序占相当大的比例,其核心就是字符串处理
1.1.字符测试
1.1.1.测试字符是否为英文字母
int isalpha(int c)。若c为英文字母,则返回非零值,否则返回值为0
1.1.2.测试字符是否为数字
int isdigit(int c)。若c为数字,则返回非零值,否则返回值为0
1.2.字符串初始化
在C语言中,字符串被当做字符数组来处理,对应于内存中的一块连续的区域
可以使用 void *memset(void *buffer, int c, int count)来对这块连续的内存初始化
buffer是指针,指向我们要初始化的连续内存的首地址
参数c,是用来说明将这块内存都初始化为哪个字符,若c为0的话,就是将这块内存清零
参数count,设置的内存的字节数
例子
#include<stdio.h> #include<string.h> int main() { char s[]="hello world"; printf("%s\n", s); memset(s, ‘H‘, 5); printf("%s\n", s); return 0; }
输出结果是:
hello world
HHHHH world
1.3.字符串的复制
1.3.1. char *strcpy(char *dest, char *src)
将src指向的字符串,复制给dest所指向的内存。
注意:这两个参数所指向的内存区域是不允许重叠的
函数的返回值是指向 dest的指针
1.3.2. char *strdup(char *s)
函数的返回值是指向被复制的字符串的指针,所指向的内存区域是系统自动分配的
1.3.3. void *memcpy(void *dest, void *src, unsigned int count)
将参数src所指向的内存区域复制count个字节到dest所指向的内存区域
这两个指针所指向的内存区域也是不可以重叠的
函数的返回值是指向 dest的指针
和strcpy 的不同之处在于:memcpy给源内存和目标内存的指针之后,复制指定大小(unsigned int count)的内存,而不检查内存中的具体内容,包括字符串的结束符,而前面的strcpy 函数是一旦遇到字符串的结束符则立即停止复制
所以 memcpy并没有将参数当做字符串来看待
1.3.4. void *memmove(void *dest, const void *src, size_t n)
将参数src所指向的内存区域复制n 个字节到dest所指向的内存区域
和strcpy、memcpy不同的是这两个指针所指向的内存区域是可以重叠的
例子
#include<stdio.h> #include<string.h> int main() { char s[] = "Linux C Programming"; printf("%s\n", s); memmove(s, s+6, strlen(s)-6); s[strlen(s)-6] = ‘\0‘; printf("%s\n", s); return 0; }
输出结果是
Linux C Programming
C Programming
1.4.字符串的比较
1.4.1. int strcmp(const char *s1, const char *s2)
比较参数s1 和 s2所指向的字符串,比较的依据是字符的ASCII码的值,首先将s1的第一个字符减去s2 的第一个字符,如果相同则继续比较第二个字符,如此往后比较。如果字符串相同,则返回值为0,如果不相同,则返回不相同出的字符的ASCII码的差值
1.4.2. int strncmp(const char *s1, const char * s2, size_t n)
比较s1 和s2 所指向的字符串的前 n个字节
1.4.3. int strcasecmp(const char *s1, const char *s2)
类似于 strcmp,但是在比较的过程中是忽略大小写的
1.4.4. int strncasecmp(const char *s1, const char *s2, size_t n);
类似于 strncmp,但是在比较的过程中是忽略大小写的
1.4.5. int memcmp(const void *s1, const void *s2, size_t n)
比较s1 和s2 所指向的内存空间的前 n个字节,但是它在比较时候,并不是将 s1 和s2 当做字符串的,并不会考虑内存区域中的字符串结束符
1.5.字符/字符串查找
1.5.1. char *index(const char *s, int c)
在参数s1 做指向的字符串中,从前往后查找字符c,如果找到c 第一次出现的位置,就返回指向这个位置的指针,如果找不到这个字符,就返回 null
例子
#include<stdio.h> #include<string.h> int main() { char s[] = "hello world"; char *p; p = index(s, ‘w‘); printf("%s\n", p); return 0; }
输出结果是
world
1.5.2. char *rindex(const char *s, int c)
和 index 类似,不过是从后往前查找
1.5.3. char *strchr(const char *s, int c)
和 index 类似,但是不能查找 ‘\0‘这个字符。可以用 index(s, ‘\0‘)的形式,但是不能用 strchr(s, ‘\0‘)
1.5.4. char strrctr(const char *s, int c)
和 rindex 类似,但是不能查找 ‘\0‘这个字符。可以用 rindex(s, ‘\0‘)的形式,但是不能用 strrchr(s, ‘\0‘)
1.5.5. char *strstr(const char *haystack, const char *needle)
在字符串haystack中查找字符串needle,并返回第一次出现的位置,如果没有找到就返回一个空指针
1.6.字符串连接分割
1.6.1. char *strcat(char *dest, const char *src)
将 src所指向的字符串连接到 dest所指向的字符串,返回目标指针的起始地址
注意,目标字符串必须有足够的缓冲区,否则会发生溢出
例子
#include<stdio.h> #include<string.h> #define BUFFER_SIZE 64 int main() { char s[BUFFER_SIZE] = "orld; char d[BUFFER_SIZE] = "hello w"; strcat(d, s); printf("%s\n", s); printf("%s\n", d); return 0; }
输出结果是
orld
hello world
1.6.2. char *strncat(char *dest, const char *src, size_t n)
从src 取出n 个字节,连接到dest 所指向的字符串。
如果src的前n 个字节中没有出现‘\0‘,那么会在结尾处自动添加一个‘\0‘
1.6.3. char *strtok(char *str, const char *delim)
将 str字符串使用 delim这个分割符号来进行分割。如果在字符串str 找到任何一个分隔符则将其更改为字符串的结束符
例子
#include<strio.h> #include<string.h> int main() { char str[] = "Linux C Programming"; char *p; p = strtok(str, " "); while(p != NULL) { printf("%s\n", p); p = strtok(NULL, " "); } printf("str : "%s\n", str); return 0; }
输出结果是
C
Programming
str : Linux
2.数据转换
数据转换包括英文字母大小写之间的转换、字符串与整数、浮点数之间的转换
2.1.字母大小写转换
int toupper(int c) 将小写英文字母转换为大写,如果 c是小写字母则返回对应的大写字母,否则返回原来的值
int tolower(int c) 将大写英文字母转换为小写,原理类似上面的那个
2.2.字符串转换
实现字符串与整数、浮点数之间转换
2.2.1. 将字符串转换为整数
int atoi(const char *nptr)
long atol(const char * nptr)
这两个函数首先对字符串进行扫描,直到出现数字或者正负号才开始转换,然后再出现非数字或者字符串结束符就停止转换并将结果返回
只能转换10进制的字符串
例子
#include<stdio.h> #include<string.h> int main() { char a[] = "-100"; char b[] = "0x20"; int c; c = atoi(a) + atoi(b); printf("c = %d\n", c); return 0; }
输出结果是
-100
因为,将a转换为 -100,而b是0x20,转换时,先将0转换为0,遇到x就停止转换
2.2.2. 将字符串转换为浮点数
double atof(const char *nptr)
函数首先对字符串进行扫描,直到出现数字或者正负号才开始转换,然后再出现非数字或者字符串结束符就停止转换并将结果返回
这个函数中,字符串可以包含+、-、小数点、E、e(E、e表示浮点数的指数部分)
2.2.3. 将浮点数转换为字符串
char *gcvt(double number, size_t ndigits, char *buf)
第一个参数是要转换的浮点数
第二个参数是要显示的位数
第三个参数是用来存放最终结果的一个缓冲区
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。