Rust file I/O очень медленный по сравнению с C. Что-то не так?
Чтобы сравнить производительность файлового ввода-вывода между C и Rust, я записываю "test" в файл 100 000 000 раз и читаю 4 байта из файла 100 000 000 раз.
По сравнению с C код Rust потратил более 450 раз системного времени на запись и 140 раз на чтение.
Я подозреваю, что есть лучшие способы добиться быстрого ввода-вывода; Как улучшить производительность файлового ввода-вывода в Rust?
$ rustc --version
rustc 1.16.0
$ rustc rswrite.rs -C opt-level=3 # Rust for writing
$ time ./rswrite
real 1m8.411s
user 0m3.817s
sys 1m4.533s
$ rustc rsread.rs -C opt-level=3 # Rust for reading
$ time ./rsread
real 0m18.077s
user 0m2.130s
sys 0m15.910s
$ gcc -O3 cwrite.c -ocwrite # C for writing
$ time ./cwrite
real 0m1.564s
user 0m1.397s
sys 0m0.143s
$ gcc -O3 cread.c -ocread # C for reading
$ time ./cread
real 0m1.353s
user 0m1.240s
sys 0m0.113s
Руст код для написания:
use std::fs;
use std::io::Write;
fn main() {
let b = b"test";
let mut f = fs::File::create("rs.dump").unwrap();
for _ in 0 .. 100_000_000 {
f.write(b).unwrap();
}
}
Код ржавчины для чтения:
use std::{fs, mem};
use std::io::Read;
fn main() {
let mut f = fs::File::open("rs.dump").unwrap();
let mut b: [u8; 4] = unsafe { mem::uninitialized() };
for _ in 0 .. 100_000_000 {
f.read_exact(&mut b).unwrap();
}
}
C код для записи:
#include <stdio.h>
#define N 100000000
int main()
{
const char *teststr = "test";
FILE *fp = fopen("c.dump", "wb");
unsigned long long i;
for (i=0; i<N; i++) fwrite(teststr, 4, 1, fp);
fclose(fp);
return 0;
}
C-код для чтения:
#include <stdio.h>
#define N 100000000
int main() {
FILE *fp = fopen("c.dump", "rb");
long long i;
char buf[4];
for (i=0; i<N; i++) fread(buf, 4, 1, fp);
fclose(fp);
return 0;
}
1 ответ
Решение
Моя программа Rust не использовала буферизованный ввод-вывод. Благодаря комментариям BurntSushi5 и Эндрю Хенле, проблема решена.
$ strace ./rswrite
write(3, "test", 4) = 4
write(3, "test", 4) = 4
...
$ strace ./rswrite
read(3, "test", 4) = 4
read(3, "test", 4) = 4
...
Я изменил код:
use std::fs;
use std::io::{BufWriter, Write};
fn main() {
let b = b"test";
/**** Use std::io::BufWriter ****/
let mut f = BufWriter::new(fs::File::create("rs.dump").unwrap());
for _ in 0 .. 100_000_000 {
f.write(b).unwrap();
}
}
а также
use std::{fs, mem};
use std::io::{BufReader, Read};
fn main() {
/**** Use std::io::BufReader ****/
let mut f = BufReader::new(fs::File::open("rs.dump").unwrap());
let mut b: [u8; 4] = unsafe { mem::uninitialized() };
for _ in 0 .. 100_000_000 {
f.read_exact(&mut b).unwrap();
}
}
Теперь ввод / вывод буферизуется.
write(3, "testtesttesttesttesttesttesttest"..., 8192) = 8192
write(3, "testtesttesttesttesttesttesttest"..., 8192) = 8192
...
Производительность так же быстро, как C.
$ time ./rswrite
real 0m1.341s
user 0m0.213s
sys 0m0.200s
$ time ./rsread_buf
real 0m0.596s
user 0m0.540s
sys 0m0.050s