小Hi和小Ho正在进行一项基因工程实验。他们要修改一段长度为N的DNA序列,使得这段DNA上最前面的K个碱基组成的序列与最后面的K个碱基组成的序列完全一致。
例如对于序列"ATCGATAC"和K=2,可以通过将第二个碱基修改为"C"使得最前面2个碱基与最后面两个碱基都为"AC"。当然还存在其他修改方法,例如将最后一个碱基改为"T",或者直接将最前面两个和最后面两个碱基都修改为"GG"。
小Hi和小Ho希望知道在所有方法中,修改碱基最少的方法需要修改多少个碱基。
第一行包含一个整数T(1 <= T <= 10),代表测试数据的数量。
每组测试数据包含2行,第一行是一个由"ATCG"4个大写字母组成的长度为N(1 <= N <= 1000)的字符串。第二行是一个整数K(1 <= K <= N)。
对于每组数据输出最少需要修改的碱基数量。
2 ATCGATAC 2 ATACGTCT 6
1 3
对于测试案例 ATACGTCT
s1 : A T A C G T
s2 : A C G T C T
最少的修改应该是修改s2[1]为T,对应的此时s1[3]也改成了T;再修改s2[2]为A,对应s1[4]改为A;再修改s2[4]为A
把string扯直了,发现变成ATATATAT了,事后发现,原来是把string下标模(n-k)同余的都改成相同的字符就行了。而最小的修改数量就是统计string下标同余的字符,找到该组频率最大的那个字符, 并把这组字符都变成频率最大的那个。
#include <iostream> #include <string> using namespace std; int main() { int t; cin >> t; char c[4] = { 'A', 'C', 'G', 'T' }; while (t--) { string s; int k; cin >> s >> k; int n = s.size(); int ans = 0; for (int i = 0; i <= n-k -1; i++) { int word[26] = { 0 }; int p = i; while (p < n) { word[s[p] - 'A']++; p = p + n - k; } int sum = 0; int max_sum = 0; for (int j = 0; j < 4; j++) { sum += word[c[j] - 'A']; if (max_sum < word[c[j] - 'A']) max_sum = word[c[j] - 'A']; } ans += sum - max_sum; } cout << ans << endl; } system("pause"); return 0; }
原文地址:http://blog.csdn.net/youb11/article/details/45890813