这两天敲的电子词典中涉及到电子词典打开以及为电子词典词条分配内存的问题,其中经过了三次的改进措施,下边对这三种方式的改进过程做如下总结:
第一种方法:
第一种方法对电子词典内存分配的方式是为其分配一个指定大小的空间,实现代码如下:
<pre class="cpp" name="code"><span style="font-family:KaiTi_GB2312;font-size:24px;">//声明虽大的记录条数
#define MAX 111111
struct dict
{
char *key;//词条
char *content;//词条对应的翻译
};
//打开字典文件,并读取文件内容
int open_dict(struct dict **p, const char *dict_filename)
{
FILE *pfile = fopen(dict_filename, "r");
if (pfile == NULL)
return 0;//打开文件失败,函数返回
*p = (struct dict *)malloc(sizeof(struct dict) * MAX);//固定分配MAX大小内存
memset(*p, 0, sizeof(struct dict) * MAX);//将分配内存初始化为0
struct dict *pD = *p;//pD指向数组p的首地址
char buf[1024] = { 0 };
size_t len = 0;
int i = 0;//计数器
while (!feof(pfile))//循环读取文件,直到文件末尾
{
memset(buf, 0, sizeof(buf));
fgets(buf, sizeof(buf), pfile);//读取文件一行
len = strlen(buf);//得到读取到字符串长度
if (len > 0)
{
pD[i].key = (char *)malloc(len);//根据字符串长度分配内存
memset(pD[i].key, 0, len);
strcpy(pD[i].key, &buf[1]);//将读取到的内容拷贝到key中
}
memset(buf, 0, sizeof(buf));
fgets(buf, sizeof(buf), pfile);
len = strlen(buf);
if (len > 0)
{
pD[i].content = (char *)malloc(len);
memset(pD[i].content, 0, len);
strcpy(pD[i].content, &buf[6]);
}
i++;//计数器加1
}
fclose(pfile);//关闭字典文件
return i;//返回读取到的字典词条数
}</span>该方法是先分配一个固定大小的空间存放数据,然后再读取数据获得实际的词条数。该方法的问题是:当词典的词条数量很大时,指定的一个大小的空间可能会不够用而导致问题,因此就有了下边的方法。
第二种方法:
第二种方法弥补了第二种方法的问题:它是先获得词典中的词条数,然后再根据获得的词条数为词典分配对应的存储空间。如此一来既不会造成空间的浪费,也不会发生上边第一种方法造成分配空间不足的问题现象。其实现代码如下:
<pre class="cpp" name="code"><span style="font-family:KaiTi_GB2312;font-size:24px;">struct dict
{
char *key;
char *content;
};
int get_dict_size(FILE *pfile)//得到字典文件中词条总数
{
if (pfile == NULL)
return 0;
int i = 0;
char buf[2048];
while (!feof(pfile))
{
fgets(buf, sizeof(buf), pfile);
fgets(buf, sizeof(buf), pfile);
i++;//读取两行后,计数器加1
}
return i;
}
//打开字典文件,并读取文件内容
int open_dict(struct dict **p, const char *dict_filename)
{
FILE *pfile = fopen(dict_filename, "r");
if (pfile == NULL)
return 0;//打开文件失败,函数返回
int size = get_dict_size(pfile);//得到字典文件中词条总数
if (size == 0)
return 0;
*p = (struct dict *)malloc(sizeof(struct dict) * size);//根据字典文件词条总数分配内存
memset(*p, 0, sizeof(struct dict) * size);//将分配内存初始化为0
struct dict *pD = *p;//pD指向数组p的首地址
char buf[2048] = { 0 };
size_t len = 0;
int i = 0;
fseek(pfile, 0L, SEEK_SET);//设置读取位置为字典文件开始
while (!feof(pfile))//循环读取文件,直到文件末尾
{
memset(buf, 0, sizeof(buf));
fgets(buf, sizeof(buf), pfile);//读取文件一行
len = strlen(buf);//得到读取到字符串长度
if (len > 0)
{
pD[i].key = (char *)malloc(len);//根据字符串长度分配内存
memset(pD[i].key, 0, len);
strcpy(pD[i].key, &buf[1]);//将读取到的内容拷贝到key中
}
memset(buf, 0, sizeof(buf));
fgets(buf, sizeof(buf), pfile);
len = strlen(buf);
if (len > 0)
{
pD[i].content = (char *)malloc(len);
memset(pD[i].content, 0, len);
strcpy(pD[i].content, &buf[6]);
}
i++;
}
fclose(pfile);//关闭字典文件
return i;//返回读取到的字典词条数
}</span>
第三种方法:
其实第二种方法在运行上是不会出什么问题的,考虑到代码执行效率,我们可以借助链表的这种数据结构来处理这一内存分配问题,主要思想是我们可以一边读取词条,一边为其分配存储空间,该过程需要有一块存储空间来存放下一个词条的地址信息(指针),于是我们就需要在词条结构的字段中添加一个新的字段来存放下一个词条的指针。其实现代码如下:
<span style="font-family:KaiTi_GB2312;font-size:24px;">struct dict
{
char *key;
char *content;
struct dict *next;//指向链表下一个节点的指针
};
//打开字典文件,并读取文件内容
int open_dict(struct dict **p, const char *dict_filename)//open dict.txt,and read dict
{
FILE *pfile = fopen(dict_filename, "r");//只读方式打开文件
if (pfile == NULL)
return 0;//打开文件失败,函数返回
char buf[2048] = { 0 };
size_t len = 0;
int i = 0;//计数器,记录读到到的词条总数
*p = (struct dict *)malloc(sizeof(struct dict));//分配链表首节点内存
memset(*p, 0, sizeof(struct dict));
struct dict *pD = *p;//pD指向链表首地址
while (!feof(pfile))//循环读取文件,直到文件末尾
{
memset(buf, 0, sizeof(buf));
fgets(buf, sizeof(buf), pfile);//读取文件一行
len = strlen(buf);//得到读取到字符串长度
if (len > 0)
{
pD->key = (char *)malloc(len);//根据字符串长度分配内存
memset(pD->key, 0, len);
strcpy(pD->key, &buf[1]);//将读取到的内容拷贝到key中
}
memset(buf, 0, sizeof(buf));
fgets(buf, sizeof(buf), pfile);
len = strlen(buf);
if (len > 0)
{
pD->content = (char *)malloc(len);
memset(pD->content, 0, len);
strcpy(pD->content, &buf[6]);
}
pD->next = (struct dict *)malloc(sizeof(struct dict));//为链表的下一个节点分配内存
memset(pD->next, 0, sizeof(struct dict));
pD = pD->next;//将pD指向下一个节点位置
i++;
}
fclose(pfile);//关闭字典文件
return i;//返回读取到的字典词条数
}</span> 这三次纠错和优化提高了代码的健壮性,和执行的效率,同时也从中学习了很多关于文件和内存分配以及有关数据结构链表的分配、访问以及释放的相关操作方法。在后面学习的过程中还会继续用到C语言的相关知识,以C语言为基础做一些相关任务。原文地址:http://blog.csdn.net/rcj183419/article/details/46301101