小Hi和小Ho正在进行一项基因工程实验。他们要修改一段长度为N的DNA序列,使得这段DNA上最前面的K个碱基组成的序列与最后面的K个碱基组成的序列完全一致。
例如对于序列"ATCGATAC"和K=2,可以通过将第二个碱基修改为"C"使得最前面2个碱基与最后面两个碱基都为"AC"。当然还存在其他修改方法,例如将最后一个碱基改为"T",或者直接将最前面两个和最后面两个碱基都修改为"GG"。
小Hi和小Ho希望知道在所有方法中,修改碱基最少的方法需要修改多少个碱基。
第一行包含一个整数T(1 <= T <= 10),代表测试数据的数量。
每组测试数据包含2行,第一行是一个由"ATCG"4个大写字母组成的长度为N(1 <= N <= 1000)的字符串。第二行是一个整数K(1 <= K <= N)。
对于每组数据输出最少需要修改的碱基数量。
2 ATCGATAC 2 ATACGTCT 6
1 3
对于测试案例 ATACGTCT
s1 : A T A C G T
s2 : A C G T C T
最少的修改应该是修改s2[1]为T,对应的此时s1[3]也改成了T;再修改s2[2]为A,对应s1[4]改为A;再修改s2[4]为A
把string扯直了,发现变成ATATATAT了,事后发现,原来是把string下标模(n-k)同余的都改成相同的字符就行了。而最小的修改数量就是统计string下标同余的字符,找到该组频率最大的那个字符, 并把这组字符都变成频率最大的那个。
#include <iostream>
#include <string>
using namespace std;
int main()
{
int t;
cin >> t;
char c[4] = { 'A', 'C', 'G', 'T' };
while (t--)
{
string s;
int k;
cin >> s >> k;
int n = s.size();
int ans = 0;
for (int i = 0; i <= n-k -1; i++)
{
int word[26] = { 0 };
int p = i;
while (p < n)
{
word[s[p] - 'A']++;
p = p + n - k;
}
int sum = 0;
int max_sum = 0;
for (int j = 0; j < 4; j++)
{
sum += word[c[j] - 'A'];
if (max_sum < word[c[j] - 'A'])
max_sum = word[c[j] - 'A'];
}
ans += sum - max_sum;
}
cout << ans << endl;
}
system("pause");
return 0;
}
原文地址:http://blog.csdn.net/youb11/article/details/45890813