在一个大型工程当中,由于代码人员的多样性,使得代码的注释风格不同。然而在发布版本中,注释风格应该保持一致,以便于其他人员在后期的使用和维护。 由此,产生了如下的需求:
实现对一个C/C++语言程序源文件中注释的转换功能(在这里 我们实现的是C++注释转换为标准C语言注释)
注释转化的要求:
其他注意事项:
具体分析:
在读取源文件的时候,可能遇到的情况有: C 风格注释(包含注释的嵌套),C++ 风格注释(包含注释的嵌套),字符中嵌套注释,无注释 ,结束等几种状态。
引入 “状态机”概念:
状态机简写为FSM(Finite State Machine),主要分为2大类:第一类,若输出只和状态有关而与输入无关,则称为Moore状态机;第二类,输出不仅和状态有关而且和输入有关系,则称为Mealy状态机。
状态机可归纳为4个要素,即现态、条件、动作、次态。这样的归纳,主要是出于对状态机的内在因果关系的考虑。"现态"和"条件"是因,"动作"和"次态"是果。详解如下:
①现态:是指当前所处的状态。
②条件:又称为"事件",当一个条件被满足,将会触发一个动作,或者执行一次状态的迁移。
③动作:条件满足后执行的动作。动作执行完毕后,可以迁移到新的状态,也可以仍旧保持原状态。动作不是必需的,当条件满足后,也可以不执行任何动作,直接迁移到新状态。
④次态:条件满足后要迁往的新状态。"次态"是相对于"现态"而言的,"次态"一旦被激活,就转变成新的"现态"了。
往往将抽象的状态转化为状态转移图:
从输入文件读取字符,判读并修改注释,生成新文件。(文件的操作 在这里不做概述)
代码实现:
主程序
#include<iostream> using namespace std; extern int CommentConvert(FILE *inputfile, FILE *outputfile); int main() { FILE *fpIn = NULL; //inputfile FILE *fpOut = NULL; //outputfile errno_t err; err = fopen_s(&fpIn, "input.c", "r"); if ((err = fopen_s(&fpIn, "input.c", "r")) != 0) { cout << "Open input file fail!" << endl; //return -1; } if ((err = fopen_s(&fpOut, "output.c", "w")) != 0) { cout << "Open output file fail!" << endl; //return -1; } CommentConvert(fpIn, fpOut); // fclose(fpIn); fclose(fpOut); return 0; }
注释转换程序:
#include<iostream> using namespace std; #define STACKSIZE 1024 #define UL unsigned long extern int CommentConvert(FILE *inputfile, FILE *outputfile); typedef enum { NO_COMMENT_STATE, C_COMMENT_STATE, CPP_COMMENT_STATE, STR_STATE, END_STATE }STATE_ENUM;//状态列表 typedef struct { FILE *inputfile; FILE *outputfile; STATE_ENUM ulstate; }STATE_MACHINE; //状态机 // STATE_MACHINE g_state = { 0 }; /////////////////////////////////////////////////// void EventPro(char ch);//事件驱动 void EventProAtNo(char ch); void EventProAtC(char ch); void EventProAtCpp(char ch); void EventProAtStr(char ch); //////////////////////////////////////////////////// int CommentConvert(FILE *inputfile, FILE *outputfile) { if (inputfile == NULL || outputfile == NULL) { cout << "input argument Invalid!" << endl; return -1; } g_state.inputfile = inputfile; g_state.outputfile = outputfile; g_state.ulstate = NO_COMMENT_STATE; //初始状态为无注释状态 char ch; while (g_state.ulstate != END_STATE) { ch = fgetc(g_state.inputfile); // EventPro(ch); } return 0; } void EventPro(char ch) //事件驱动模型 { switch (g_state.ulstate) //不同的事件状态使用不同的状态函数 { case NO_COMMENT_STATE: EventProAtNo(ch); break; case C_COMMENT_STATE: EventProAtC(ch); break; case CPP_COMMENT_STATE: EventProAtCpp(ch); break; case STR_STATE: EventProAtStr(ch); break; case END_STATE: break; } } void EventProAtNo(char ch) { char nextch; switch (ch) { case '/': // // /* nextch = fgetc(g_state.inputfile); if (nextch == '/') // C++ { fputc('/', g_state.outputfile); fputc('*', g_state.outputfile); //将CPP的//转化为/* g_state.ulstate = CPP_COMMENT_STATE;//转换为CPP状态 } else if (nextch == '*') //C { fputc(ch, g_state.outputfile); fputc(nextch, g_state.outputfile); g_state.ulstate = C_COMMENT_STATE;//转换为C状态 } else { } break; case EOF: g_state.ulstate = END_STATE; break; case '"': g_state.ulstate = STR_STATE; default: fputc(ch, g_state.outputfile); break; } } void EventProAtC(char ch) { char nextch; switch (ch) { case '*': nextch = fgetc(g_state.inputfile); if (nextch == '/') { fputc(ch, g_state.outputfile); fputc(nextch, g_state.outputfile); g_state.ulstate = NO_COMMENT_STATE; } break; case '/': nextch = fgetc(g_state.inputfile); if (nextch == '/') { fputc(' ', g_state.outputfile); fputc(' ', g_state.outputfile);//嵌套注释用两个空格代替 } break; default: fputc(ch, g_state.outputfile); break; } } void EventProAtCpp(char ch) { //123 /*123 char nextch; switch (ch) { case '\n': //处理多行 fputc('*', g_state.outputfile); fputc('/', g_state.outputfile); fputc('\n', g_state.outputfile); g_state.ulstate = NO_COMMENT_STATE; break; case EOF: fputc('*', g_state.outputfile); fputc('/', g_state.outputfile); g_state.ulstate = END_STATE; break; case '/': nextch = fgetc(g_state.inputfile); if (nextch == '/') // (嵌套//) { fputc(' ', g_state.outputfile); fputc(' ', g_state.outputfile); } else if (nextch == '*') // (嵌套 /*) { fputc(' ', g_state.outputfile); fputc(' ', g_state.outputfile); } else { fputc(ch, g_state.outputfile); } break; case '*': nextch = fgetc(g_state.inputfile); if (nextch == '/') // 嵌套// { fputc(' ', g_state.outputfile); fputc(' ', g_state.outputfile); } else { fputc(ch, g_state.outputfile); } break; case'"': g_state.ulstate = STR_STATE; default: fputc(ch, g_state.outputfile); break; } } void EventProAtStr(char ch) { char nextch; switch (ch) { case '\0': nextch = fgetc(g_state.inputfile); if (nextch == '"') //读取到 \0 和 " 说明字符串结束 g_state.ulstate = NO_COMMENT_STATE; //状态切换 break; case EOF: g_state.ulstate = END_STATE; break; default: fputc(ch, g_state.outputfile); break; } }
测试用例(input文件):
//每个区由若干个内存块组成 //每个区由若干个内存块组成,//每个块是4096个字节 //int i = 0;*/ //*//*int i = 0; // /**/int i = 0; /* int i = 0; *//* */ /* int i = 0; //*/int j = 0; /* //每个区由若干个内存块组成,每个块是4096个字节 //每个块的第0个整数指向下个区 //所以是单链表结构 //所以每个区只有4092个字节存放真正的数据 */ /* int i = 0;*//*int j = 0; */ /* *//* */int i = 0; //////////////////////////////////////////////////////////////////// 5 "abcdefghijklmn~~~~!!!!!!!!" //dsgf sdfg " fs sdfsg // /* */ " " fs sdfsg // /* */ "
输出文件(output):
/*每个区由若干个内存块组成*/ /*每个区由若干个内存块组成, 每个块是4096个字节*/ /*int i = 0; */ /* int i = 0;*/ /* int i = 0;*/ /* int i = 0; *//* */ /* int i = 0; */int j = 0; /* 每个区由若干个内存块组成,每个块是4096个字节 每个块的第0个整数指向下个区 所以是单链表结构 所以每个区只有4092个字节存放真正的数据 */ /* int i = 0;*//*int j = 0; */ /* *//* */int i = 0; /* 5*/ "abcdefghijklmn~~~~!!!!!!!!" //dsgf sdfg " fs sdfsg // /* */ " " fs sdfsg // /* */ "
原文地址:http://blog.csdn.net/irean_lau/article/details/46516723