Перекрывающиеся гены
Я пытаюсь запустить свою программу, но получаю много лишней, ненужной информации. Если вы прокрутите вниз в окне вывода, второй набор генов будет правильным, где не будет совпадений, вместо первого набора. Я также получаю всего 202 гена, тогда как мне нужно только 89.
Есть другая часть, которая действительно смущает меня; в моем выводе кода есть много данных CGRatio и длины; как мне организовать это так, чтобы программа выдала мне только сколько CGRatio >0.35 и сколько строк длиннее 60 символов. Примечание: CGRatio - это число c и g в цепочке ДНК, деленное на длину строки. Я также хотел бы знать, сколько символов в этом файле.
Примечание: основной метод был изменен на printGenes, потому что среда BlueJ не может вызывать main. Примечание: мы не узнали, как использовать что-либо кроме основ; Класс StorageResource, класс DirectoryResource и класс FileResource - это то, чему научили в этом классе из библиотеки Duke (т.е.
import java.io.*;
import edu.duke.FileResource;
import edu.duke.StorageResource;
import edu.duke.DirectoryResource;
) И просто основные манипуляции со строками и для циклов и в то время как.
Вот файл, используемый в программе: http://www.dukelearntoprogram.com/course2/data/dna.zip
Вот мой код:
import java.io.*;
import edu.duke.FileResource;
import edu.duke.StorageResource;
import edu.duke.DirectoryResource;
public class FindMultiGenes5 {
public int findStopIndex(String dna, int index) {
int stop1 = dna.indexOf("TGA", index);
if (stop1 == -1 || (stop1 - index) % 3 != 0) {
stop1 = dna.length();
}
int stop2 = dna.indexOf("TAA", index);
if (stop2 == -1 || (stop2 - index) % 3 != 0) {
stop2 = dna.length();
}
int stop3 = dna.indexOf("TAG", index);
if (stop3 == -1 || (stop3 - index) % 3 != 0) {
stop3 = dna.length();
}
return Math.min(stop1, Math.min(stop2, stop3));
}
public StorageResource storeAll(String dna) {
String sequence = dna.toUpperCase();
StorageResource store = new StorageResource();
int index = 0;
while (true) {
index = sequence.indexOf("ATG", index);
if (index == -1)
break;
int stop = findStopIndex(sequence, index + 3);
if (stop != sequence.length()) {
String gene = dna.substring(index, stop + 3);
store.add(gene);
System.out.println("From: " + index + " to " + stop + " Gene: " + gene );//index = sequence.substring(index, stop + 3).length();
index = stop + 3; // start at the end of the stop codon
}else{ index = index + 3;
}
}
return store;//System.out.println(sequence);
}
public void testStorageFinder() {
DirectoryResource dr = new DirectoryResource();
StorageResource dnaStore = new StorageResource();
for (File f : dr.selectedFiles()) {
FileResource fr = new FileResource(f);
String s = fr.asString();
dnaStore = storeAll(s);
printGenes(dnaStore);
}
System.out.println("size = " + dnaStore.size());
}
public String readStrFromFile(){
FileResource readFile = new FileResource();
String DNA = readFile.asString();
//System.out.println("DNA: " + DNA);
return DNA;
}//end readStrFromFile() method;
public float calCGRatio(String gene){
gene = gene.toUpperCase();
int len = gene.length();
int CGCount = 0;
for(int i=0; i<len; i++){
if(gene.charAt(i) == 'C' || gene.charAt(i) == 'G')
CGCount++;
}//end for loop
System.out.println("CGCount " + CGCount + " Length: " + len + " Ratio: " + (float)CGCount/len);
return (float)CGCount/len;
}//end of calCGRatio() method;
public void printGenes(StorageResource sr){
for(String gene: sr.data()){
if (gene.length() > 60) {
System.out.println(gene.length()+"\t"+gene);
}
if(calCGRatio(gene)> 0.35) {
System.out.println(gene.length()+"\t"+gene);
}
}
//create a FindMultiGenesFile object FMG
FindMultiGenes5 FMG = new FindMultiGenes5();
//read a DNA sequence from file
String dna = FMG.readStrFromFile();
FMG.storeAll(dna);
//store all genes into a document
StorageResource dnaStore = new StorageResource();
int longerthan60 = 0;
int CGGreaterthan35 = 0;
System.out.println("\n There are " + dnaStore.size() + " genes. ");
System.out.println("There are " + longerthan60 + " genes longer than 60.");
System.out.println("There are " + CGGreaterthan35 + " genes with CG ratio greater than 0.35.");
}//end main();
}