码迷,mamicode.com
首页 > 编程语言 > 详细

对map的value进行排序的方法

时间:2016-05-18 19:51:46      阅读:364      评论:0      收藏:0      [点我收藏+]

标签:

对map的value进行排序的方法,注意思路,以及CMPBYVALUE的用法
<h1 class="title" style="margin: 10px 0px; font-family: 'lucida grande', 'lucida sans unicode', lucida, helvetica, 'Hiragino Sans GB', 'Microsoft YaHei', 'WenQuanYi Micro Hei', sans-serif; line-height: 1.5; color: rgb(85, 85, 85); text-rendering: optimizelegibility; font-size: 32px; word-break: break-all;">map按键排序和按值排序</h1><div class="show-content" style="color: rgb(47, 47, 47); font-size: 16px; line-height: 1.7; font-family: 'lucida grande', 'lucida sans unicode', lucida, helvetica, 'Hiragino Sans GB', 'Microsoft YaHei', 'WenQuanYi Micro Hei', sans-serif;"><p style="margin-top: 0px; margin-bottom: 25px; text-align: justify; word-break: break-word;">前几天做了一个关于字符串的题,题目要求寻找一个字符串中出现最多的子串是哪一个,没想到什么很有技巧的想法,于是就打算遍历所有的子串,利用一个map实现,其键值为对应的子串,value为子串出现的个数,遍历玩所有的子串后,只要寻找最大的value的键值就可以了,这里就想到一个问题,map一般是按键排序,能否按value排序?</p><p style="margin-top: 0px; margin-bottom: 25px; text-align: justify; word-break: break-word;">首先给出上述题目的一个解法,然后再继续讨论:map按键排序和按值排序的问题。如下所示,map查询采用find不要直接查询(find要是没找到则返回MAP.end()),否则会将map中不存在的键值直接插入。</p><pre class="hljs cpp" style="padding: 9.5px; font-family: Menlo, Monaco, Consolas, 'Courier New', monospace; font-size: 13px; color: rgb(101, 123, 131); border-top-left-radius: 4px; border-top-right-radius: 4px; border-bottom-right-radius: 4px; border-bottom-left-radius: 4px; margin-top: 0px; margin-bottom: 20px; line-height: 20px; word-break: break-all; word-wrap: normal; background-color: rgb(253, 246, 227); border: 1px solid rgba(0, 0, 0, 0.14902); overflow: auto;"><code class="cpp" style="padding: 0px; font-family: Menlo, Monaco, Consolas, 'Courier New', monospace; font-size: 12px; border-top-left-radius: 3px; border-top-right-radius: 3px; border-bottom-right-radius: 3px; border-bottom-left-radius: 3px; background-color: transparent; border: none;"><span class="hljs-function"><span class="hljs-keyword" style="color: rgb(133, 153, 0);">void</span> <span class="hljs-title" style="color: rgb(38, 139, 210);">substrCount</span><span class="hljs-params">(<span class="hljs-built_in" style="color: rgb(38, 139, 210);">string</span> str)</span>
</span>{
    <span class="hljs-built_in" style="color: rgb(38, 139, 210);">map</span><<span class="hljs-built_in" style="color: rgb(38, 139, 210);">string</span>,<span class="hljs-keyword" style="color: rgb(133, 153, 0);">int</span>> substr;
    <span class="hljs-built_in" style="color: rgb(38, 139, 210);">string</span> subs;
    <span class="hljs-keyword" style="color: rgb(133, 153, 0);">for</span>(<span class="hljs-keyword" style="color: rgb(133, 153, 0);">int</span> i =<span class="hljs-number" style="color: rgb(42, 161, 152);">1</span>; i<str.size();i++)
        <span class="hljs-keyword" style="color: rgb(133, 153, 0);">for</span>(<span class="hljs-keyword" style="color: rgb(133, 153, 0);">int</span> j =<span class="hljs-number" style="color: rgb(42, 161, 152);">0</span>; j<=str.size()-i;j++)
        {
            subs = str.substr(j,i);                    <span class="hljs-comment" style="color: rgb(147, 161, 161);">//遍历每一个子串</span>
            <span class="hljs-keyword" style="color: rgb(133, 153, 0);">if</span>(substr.find(subs)==substr.end())        <span class="hljs-comment" style="color: rgb(147, 161, 161);">//判断map中是否存在,存在则+1,不存在则插入</span>
                substr[subs] = <span class="hljs-number" style="color: rgb(42, 161, 152);">1</span>;
            <span class="hljs-keyword" style="color: rgb(133, 153, 0);">else</span>
                substr[subs] = substr[subs]+<span class="hljs-number" style="color: rgb(42, 161, 152);">1</span>;
        }

    pair<<span class="hljs-built_in" style="color: rgb(38, 139, 210);">string</span>, <span class="hljs-keyword" style="color: rgb(133, 153, 0);">int</span>> maxpair = *(substr.begin());     <span class="hljs-comment" style="color: rgb(147, 161, 161);">//寻找出现次数最多的子串</span>
    <span class="hljs-built_in" style="color: rgb(38, 139, 210);">map</span><<span class="hljs-built_in" style="color: rgb(38, 139, 210);">string</span>,<span class="hljs-keyword" style="color: rgb(133, 153, 0);">int</span>>::iterator it = substr.begin();
    <span class="hljs-keyword" style="color: rgb(133, 153, 0);">while</span>(it!=substr.end())
    {
        <span class="hljs-keyword" style="color: rgb(133, 153, 0);">if</span>(it->second >maxpair.second )
            maxpair = *it;
    }
    <span class="hljs-built_in" style="color: rgb(38, 139, 210);">cout</span><<maxpair.first<<endl;
    <span class="hljs-built_in" style="color: rgb(38, 139, 210);">cout</span><<maxpair.second<<endl;
}</code>

map按键排序和按值排序的问题内容来自C++ STL中Map的按Key排序和按Value排序

按键排序
  • 为了实现快速查找,map内部本身就是按序存储的(比如红黑树)。在我们插入<key, value>键值对时,就会按照key的大小顺序进行存储,其中key的类型必须能够进行<运算,且唯一,默认排序是按照从小到大便利记忆联想到需要支持小于运算
  • map的模板定义如下
    template < class Key, class T, class Compare = less<Key>,  
             class Allocator = allocator<pair<const Key,T> > > class map;
    其中第三、四个均包含默认参数,可以不指定。我们可以通过指定Compare类来指定排序的顺序。其中less<Key>是stl里面的一个函数对象(即调用操作符的类,其对象常称为函数对象(function object),它们是行为类似函数的对象,表现出一个函数的特征,就是通过“对象名+(参数列表)”的方式使用一个 类,其实质是对operator()操作符的重载)其具体定义如下
    template <class T> struct less : binary_function <T,T,bool> {  
    bool operator() (const T& x, const T& y) const  
      {return x<y;}  
    };
    它是一个带模板的struct,里面仅仅对()运算符进行了重载。与less相对的有greater,定义如下
    template <class T> struct greater : binary_function <T,T,bool> {  
    bool operator() (const T& x, const T& y) const  
      {return x>y;}  
    };
  • 因此我们在定义map的时候,可以指定如下
    map<string,int,greater<string> >
    或者定义自己的比较类comLen如下
    struct comLen{
       bool operator(const string &lhs, const string &rhs)
       {return lhs.length()<rhs.length();}
    }
    map<string,int,comLen> LenLessMap;
按value排序
  • 如何实现Map的按Value排序呢?
    第一反应是利用stl中提供的sort算法实现,这个想法是好的,不幸的是,sort算法有个限制,利用sort算法只能对序列容器进行排序,就是线性的(如vector,list,deque)。map是一个集合容器,它里面存储的元素是pair,不是线性存储的(前面提过,像红黑树),所以利用sort不能直接和map结合进行排序。
  • 迂回一下,把map中的元素放到序列容器(如vector)中,然后再对这些元素进行排序。要对序列容器中的元素进行排序,也有个必要条件:就是容器中的元素必须是可比较的,也就是实现了<操作的。
  • map是元素为pair,其已实现<操作符的重载

    template<class T1, class T2>  
    inline bool operator<(const pair<T1, T2>& x, const pair<T1, T2>& y)  
    { return x.first < y.first   || (!(y.first < x.first) && x.second < y.second); }
    • x.first < y.first指键值小于的情况
    • (!(y.first < x.first) && x.second < y.second);结合前面的情况指键相等的情形下value的情况
    • 为什么不直接写 x.first == y.first 呢? 前面讲过,作为map的key必须实现<操作符的重载,但是并不保证==符也被重载了。
  • 但上述的<操作过程不太符合我们的要求,从sort角度考虑,其定义如下
    template <class RandomAccessIterator>  
    void sort ( RandomAccessIterator first, RandomAccessIterator last );  
    template <class RandomAccessIterator, class Compare>  
    void sort ( RandomAccessIterator first, RandomAccessIterator last, Compare comp );
    与map一样均可以指定比较的类。可以定义如下的比较的类或者对象
    class combyValue
    {
       bool operator()(pair<string,int> &lhs,pair<string,int> &rhs)
       {return lhs.second<rhs.second;}
    }
  • 最后可以如下实现按照value排序
    map<string,int> m;
    元素插入过程
    vector<pair<string,int> > vec(m.begin(),m.end());
    sort(vec.begin(),vec.end(),combyValue);

因此最开始的那道题如果需要排序的话可以按如下方式写

struct CmpByValue {  
  bool operator()(const pair<string,int> & lhs, const pair<string,int> & rhs)
  {return lhs.second > rhs.second;}  
};

void substrcount(string str)
{
    map<string,int> substr;
    string subs;
    for(int i =1; i<str.size();i++)
        for(int j =0; j<=str.size()-i;j++)
        {
            subs = str.substr(j,i);
            if(substr.find(subs)==substr.end())
                substr[subs] = 1;
            else
                substr[subs] = substr[subs]+1;
        }

    vector<pair<string,int>> counts(substr.begin(),substr.end());
    sort(counts.begin(),counts.end(),CmpByValue());
    cout<<counts.begin()->first<<endl;
    cout<<counts.begin()->second<<endl;
}


我自己的代码实现!
static map<int ,int> mapwords;
void main()
{

	vector<string> info;
	bool MeorCh=true;   //设置统计公式还是中文
	FILE *fpstatic = fopen("count.txt","w");
	char *dat="answer";
	const char *QuestionId = "045176078D274A3A9CC7E5437FCFB95B" ; 
	char *title="liang";
	int size=111;

	//size = ReadFile("E:\\梁栋凯\\countstestdata\\045176078D274A3A9CC7E5437FCFB95B.dat",dat);
	//cout<<"ReadFile: "<<size<<endl;

	//size = ReadAnswerFile("E:\\梁栋凯\\countstestdata",QuestionId,title,info) ;
 //   cout<<"ReadAnswerFile: "<<size;

	//int flag=ReadAnswerFile("E:\\梁栋凯\\countstestdata",QuestionId , &answer);
	//if(flag==0)cout<<"读取成功!" <<endl;

	
	
	//连续读取文件
		
	vector<string> files;  
//  const char *pTag = ".dat";

    getFiles("E:\\梁栋凯\\countstestdata\\", files );
	std::string datFileName;

	//string dir=files[0].substr(0,25);
	//string ID=files[0].substr(25,files[0].size()-29);
	int i=0;
	if(i<12220)
	{
		QUESTIONANSWER answer1;
		for(i=0;i<files.size()&&i<=12220;i++)
		{
			string temp=files[i];
			string dir=files[i].substr(0,25);
			//路径长度+4
			string ID=files[i].substr(25,files[i].size()-29);

		    const char *sdir=dir.c_str();
		    const char *AnswerID=ID.c_str();

			int flag=ReadAnswerFile("E:\\梁栋凯\\countstestdata\\", AnswerID, &answer1);

		    if(flag==0)cout<<"读取"<<i<<"文件成功!" <<endl;
		}
		int flag1 = CountWords(answer1,MeorCh);

	}

	if(i>12220&&i<files.size())
	{
		QUESTIONANSWER answer2;
	   for(;i<files.size();i++)
		{
			string temp=files[i];
			string dir=files[i].substr(0,25);
			//路径长度+4
			string ID=files[i].substr(25,files[i].size()-29);

		    const char *sdir=dir.c_str();
		    const char *AnswerID=ID.c_str();

			int flag=ReadAnswerFile("E:\\梁栋凯\\countstestdata\\", AnswerID, &answer2);

		    if(flag==0)cout<<"读取"<<i<<"文件成功!" <<endl;
		}
		int flag1 = CountWords(answer2,MeorCh);
	
	}

	
	////统计字符出现的频率
	//int flag1 = CountWords(answer,MeorCh); 

struct CmpByValue {  
  bool operator()(const pair<int,int> & lhs, const pair<int,int> & rhs)
  {return lhs.second > rhs.second;}  
};
	//转存map到vector
	vector<pair<int,int> > vec(mapwords.begin() , mapwords.end());
	//排序
	cout<<"sort vector start!"<<endl;
	sort(vec.begin(),vec.end(),CmpByValue());

	for(int i=0; i<vec.size();i++)
	{
		fprintf(fpstatic, "%d,   %d\n", vec[i].first,vec[i].second );
		cout<<vec[i].first<<", "<<vec[i].second<<endl;
	}

	//

 //      
	//map<int, int>::iterator iter ;

 //   for(iter = mapwords.begin(); iter != mapwords.end(); ++iter)
 //   {
	//	fprintf(fpstatic, "%d,   %d\n", iter->first,iter->second );
 //       cout << iter->first << "     "
 //            << iter->second << endl;
 //   }


}

int CountWords(QUESTIONANSWER answer , bool MeorCh )
{
	bool MethorCh = MeorCh;
	if(MethorCh){
		for(unsigned int i = 0; i < answer.gramMe.size(); i++)
		{
			mapwords[answer.gramMe[i]]++;
		}
	}
	else
	{
		for(unsigned int i = 0; i < answer.gramCh.size(); i++)
		{
			mapwords[answer.gramCh[i]]++;
		}
	}
	return 1;
}

对map的value进行排序的方法

标签:

原文地址:http://blog.csdn.net/u010159842/article/details/51396238

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!