MATLAB - Создание повторяющегося процесса сканирования текста, который выполняется до тех пор, пока не будет обработан весь файл
Я начну с того, что скажу, что я новичок в Matlab, поэтому прошу прощения, если этот вопрос уже задавался, но я не смог найти ответ, который мне нужен.
Я работаю над кодом для обработки некоторых больших файлов Rainfall Radar (5-20 ГБ), я расположил код для чтения данных в 24-часовых блоках, а затем удаляю некоторые ненужные точки. Как показано ниже:
clear all; close all; clc;
% Open relevant Hyrad Rainfall Radar Output File.
C_Header=textscan(fileID,'%s %s %s %s %s %s %s %s',12,'delimiter',',');
% Read the file's header section - first 12 row in standard output file.
C_GridDataCheck=textscan(fileID,'%s %s %d',1230,'delimiter',',');
% Read the data coverage section of the file - number of rows eg 1230 is
% equal to the number of grid points used.
C_DataHeader=textscan(fileID,'%s %s %s %s %s %s %s %s',1,'delimiter',',');
% Read the column headers of the main data array.
formatSpec='%s %s %s %s %s %s %s %s';
% Load the first 118,080 rows of data (1230 = 1 x 15 Min Timestep across
% whole catchment. 1230x4 = 4,920. 4,920x24 = 118,080. Hence this sample
% size is equal to one 24 hour period.
% Combine data arrays created by textscan into one matrix
% % Load list of non-relevant grid numbers for use.
% % Check first column against list of non-relevant grid points and remove
% % all non-relevant rows
disp('24 Hour period loaded and non-relevant grid points removed')
% ------------------SECOND 24 HOUR PERIOD--------------------------------
% NB - 2000 Days between March 1st, 2008 and August 22nd, 2013
% No of Obs Per day = 118,080
% No of Obs in Dataset = 236,160,000 (rows - each row is 8 cells)
% Load the next 118,080 lines of data
%Combine data arrays created by textscan into one matrix
% % Check first column against list of non-relevant grid points and remove
% % all non-relevant rows
disp('24 Hour period loaded and non-relevant grid points removed')
%------------------THIRD 24 HOUR PERIOD-----------------------------------
% Load the next 118,080 lines of data
% Combine data arrays created by textscan into one matrix
% % Check first column against list of non-relevant grid points and remove
% % all non-relevant rows
disp('24 Hour period loaded and non-relevant grid points removed')
Я надеюсь, что этот код проясняет, чего я пытаюсь достичь. Если нет, не стесняйтесь спрашивать.
По сути, мне нужно сделать этот раздел кода:
% ------------------SECOND 24 HOUR PERIOD--------------------------------
% NB - 2000 Days between March 1st, 2008 and August 22nd, 2013
% No of Obs Per day = 118,080
% No of Obs in Dataset = 236,160,000 (rows - each row is 8 cells)
% Load the next 118,080 lines of data
%Combine data arrays created by textscan into one matrix
% % Check first column against list of non-relevant grid points and remove
% % all non-relevant rows
disp('24 Hour period loaded and non-relevant grid points removed')
Повторяйте, пока весь файл не будет обработан. Я думаю, что это должно быть около 2000 итераций. Кроме того, я знаю, что этот код очень груб и готов на данный момент, и не все так элегантно, любые полезные комментарии для новичка будут с благодарностью приняты.
Надеюсь, вы можете помочь.
После копания это было решено и упрощено с помощью цикла For, пример кода ниже.
clear all; close all; clc;
% Open relevant Hyrad Rainfall Radar Output File.
C_Header=textscan(fileID,'%s %s %s %s %s %s %s %s',12,'delimiter',',');
% Read the file's header section - first 12 row in standard output file.
C_GridDataCheck=textscan(fileID,'%s %s %d',1230,'delimiter',',');
% Read the data coverage section of the file - number of rows eg 1230 is
% equal to the number of grid points used.
C_DataHeader=textscan(fileID,'%s %s %s %s %s %s %s %s',1,'delimiter',',');
% Read the column headers of the main data array.
formatSpec='%s %f %f %f %f %s %s %f';
% Load list of non-relevant grid numbers for use.
for i=1:1
% Load the first 118,080 rows of data (1230 = 1 x 15 Min Timestep across
% whole catchment. 1230x4 = 4,920. 4,920x24 = 118,080. Hence this sample
% size is equal to one 24 hour period.
% Combine data arrays created by textscan into one matrix
% Check first column against list of non-relevant grid points and remove
% all non-relevant rows
% Convert Cell Array to Matrix for writing to CSV
csvwrite(['Day ' num2str(i) ' Data'], C_DataMatrix)
%Write to CSV