Repeated DNA Sequences

时间：2016-01-25 22:40:04 阅读：191 评论：0 收藏：0 [点我收藏+]

标签：

package cn.edu.xidian.sselab.hashtable;

import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

/**
*
* @author zhiyong wang
* title: Repeated DNA Sequences
* content:
* All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T,
* for example: "ACGAATTCCG". When studying DNA, it is sometimes useful to identify repeated sequences within the DNA.
* Write a function to find all the 10-letter-long sequences (substrings)
* that occur more than once in a DNA molecule.
*
* For example,
*
* Given s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT",
* Return
* ["AAAAACCCCC", "CCCCCAAAAA"].
*
*/
public class RepeatedDNASequences {

   //自己很不细心，错了好几个地方（1）自己没有把思路想好，就开始动笔写代码
   //（2）上来第一步没有考虑特殊情况
   //(3)每次取值范围是（i,i+10）,这两个值都没有注意，直接写的（0,10）
   //(4)只考虑了set是否包含，没有考虑set的写入情况
   //（5）没有考虑如果存在多个重复，是否要多次插入情况
   public List<String> findRepeatedDNASequences(String s){
       int length = s.length();
       List list = new ArrayList();
       if(s == null || length < 10) return list;
       Set set = new HashSet();
       for(int i=0;i<length-9;i++){
           String temp = s.substring(i, i+10);
           if(set.contains(temp) && !list.contains(temp)){
               list.add(temp);
           }else{
               set.add(temp);
           }

       }
       return list;
   }
   public static void main(String[] args) {
       RepeatedDNASequences r = new RepeatedDNASequences();
       r.findRepeatedDNASequences("CAAAAAAAAAC");
   }
}

标签：

原文地址：http://www.cnblogs.com/wzyxidian/p/5158834.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行