Как рассчитать STD Dev в файле

У меня есть входной файл, как это

@a
CTCTCTTTAGAACAATCATCACATACCCCTGGTT
+
1>1A>FDF3113B11BB1BAED1D11BAEE0ABG
@b
CAATGCAGCGAACAATGTTCTGGTGGTTGAATTT
+
111>1@11C?1AE?BFDGGGGGBGCCGGGGHHHH
....

я рассчитал средние показатели качества в этом файле, но мне нужна помощь в расчете стандартного отклонения этого показателя

вот что я сделал

import sys,csv
import numpy as np
import math

r = open(sys.argv[1],"r")

length =200
a = np.zeros(length)
b = np.zeros(length)
av = np.zeros(length)

while True:
    id = reads.readline().rstrip()
    if id == "":
       break
    seq= r.readline().rstrip()
    p = r.readline().rstrip()
    qua = r.readline().rstrip()
    l= len(qua)
    q = [ord(character) - 33 for character in qua]
    for i in range(l):
        a[i] += q[i]
        b[i] += 1

for j in range(length):
     av[j] = float(a[j]) / b[j]
     s2 = sum((x - av[j])**2  for x in q[i])/b[j] # error in this
     standard_deviation = s2**0.5
     print standard_deviation

1 ответ

Как насчет этого?

import sys,csv
import numpy as np
import math

r = open(sys.argv[1],"r")

while True:
    id = reads.readline().rstrip()
    if id == "":
       break
    seq= r.readline().rstrip()
    p = r.readline().rstrip()
    qua = r.readline().rstrip()
    q = [ord(character) - 33 for character in qua]

    mean = np.mean(q)
    standard_deviation = np.std(q)
Другие вопросы по тегам