标签:
其实类似于“出现次数统计”的问题,在很多地方都有遇到过,例如,统计一组数字中,每个数字出现的次数。这类统计大多会朝着一个方向发展,那就是大数据。此篇博客只是初级篇,本人在大数据方面一无所知,不做过多讲解。
C#版高频词汇主要需要去面对的事:
以上列举的问题有以下解决办法:
Regex reg = new Regex(@"(?i)\b(?![‘-])[a-z‘-]+(?<![‘-])\b");//去除标点,中文
继续完善的方面有以下几点:
标签:
原文地址:http://blog.csdn.net/u011669081/article/details/51367326