Перекрывающиеся гены

Я пытаюсь запустить свою программу, но получаю много лишней, ненужной информации. Если вы прокрутите вниз в окне вывода, второй набор генов будет правильным, где не будет совпадений, вместо первого набора. Я также получаю всего 202 гена, тогда как мне нужно только 89.

Есть другая часть, которая действительно смущает меня; в моем выводе кода есть много данных CGRatio и длины; как мне организовать это так, чтобы программа выдала мне только сколько CGRatio >0.35 и сколько строк длиннее 60 символов. Примечание: CGRatio - это число c и g в цепочке ДНК, деленное на длину строки. Я также хотел бы знать, сколько символов в этом файле.

Примечание: основной метод был изменен на printGenes, потому что среда BlueJ не может вызывать main. Примечание: мы не узнали, как использовать что-либо кроме основ; Класс StorageResource, класс DirectoryResource и класс FileResource - это то, чему научили в этом классе из библиотеки Duke (т.е.

import java.io.*;
import edu.duke.FileResource;
import edu.duke.StorageResource;
import edu.duke.DirectoryResource;

) И просто основные манипуляции со строками и для циклов и в то время как.

Вот файл, используемый в программе: http://www.dukelearntoprogram.com/course2/data/dna.zip

Вот мой код:

import java.io.*;
import edu.duke.FileResource;
import edu.duke.StorageResource;
import edu.duke.DirectoryResource;

public class FindMultiGenes5 {
    public int findStopIndex(String dna, int index) {
        int stop1 = dna.indexOf("TGA", index);
        if (stop1 == -1 || (stop1 - index) % 3 != 0) {
            stop1 = dna.length();
        }
        int stop2 = dna.indexOf("TAA", index);
        if (stop2 == -1 || (stop2 - index) % 3 != 0) {
            stop2 = dna.length();
        }
        int stop3 = dna.indexOf("TAG", index);
        if (stop3 == -1 || (stop3 - index) % 3 != 0) {
            stop3 = dna.length();
        }
        return Math.min(stop1, Math.min(stop2, stop3));
    }

    public StorageResource storeAll(String dna) {

        String sequence = dna.toUpperCase();
        StorageResource store = new StorageResource();
        int index = 0;


        while (true) {
            index = sequence.indexOf("ATG", index);
            if (index == -1)
                break;

            int stop = findStopIndex(sequence, index + 3);

            if (stop != sequence.length()) {
                String gene = dna.substring(index, stop + 3);
                store.add(gene);

                System.out.println("From: " + index + " to " + stop + " Gene: " + gene );//index = sequence.substring(index, stop + 3).length();
            index = stop + 3; // start at the end of the stop codon
          }else{  index = index + 3;
        }

    }
    return store;//System.out.println(sequence);
    }
   public void testStorageFinder() {
      DirectoryResource dr = new DirectoryResource();
      StorageResource dnaStore = new StorageResource(); 
    for (File f : dr.selectedFiles()) {
        FileResource fr = new FileResource(f);
        String s = fr.asString();
        dnaStore = storeAll(s);
        printGenes(dnaStore);
    }


        System.out.println("size = " + dnaStore.size());

    }  
  public String readStrFromFile(){

        FileResource readFile = new FileResource();

        String DNA = readFile.asString();

        //System.out.println("DNA: " + DNA);

        return DNA;

    }//end readStrFromFile() method;
  public float calCGRatio(String gene){

        gene = gene.toUpperCase();  
        int len = gene.length();
        int CGCount = 0;

        for(int i=0; i<len; i++){

            if(gene.charAt(i) == 'C' || gene.charAt(i) == 'G')
                CGCount++;

        }//end for loop

        System.out.println("CGCount " + CGCount + " Length: " + len + " Ratio: " + (float)CGCount/len);
        return (float)CGCount/len;
    }//end of calCGRatio() method;
    public void printGenes(StorageResource sr){
   for(String gene: sr.data()){
     if (gene.length() > 60) {
       System.out.println(gene.length()+"\t"+gene);
     }
     if(calCGRatio(gene)> 0.35) {
       System.out.println(gene.length()+"\t"+gene);
      }
  }

        //create a FindMultiGenesFile object FMG
        FindMultiGenes5 FMG = new FindMultiGenes5();

        //read a DNA sequence from file
        String dna = FMG.readStrFromFile();



        FMG.storeAll(dna);

        //store all genes into a document
        StorageResource dnaStore = new StorageResource();



        int longerthan60 = 0;
        int CGGreaterthan35 = 0;





        System.out.println("\n There are " + dnaStore.size() + " genes. ");
        System.out.println("There are " + longerthan60 + " genes longer than 60.");
        System.out.println("There are " + CGGreaterthan35 + " genes with CG ratio greater than 0.35.");
    }//end main();
}

0 ответов

Другие вопросы по тегам