Индекс слов слогов превышает размеры матрицы. Matlab

Я получил этот код, работающий, но есть небольшая проблема - я получаю сообщение об ошибке, когда индекс превышает размеры матрицы. Эта ошибка появляется, когда текстовый файл большой. Кто-нибудь может мне помочь с этим, пожалуйста?

Index exceeds matrix dimensions.
Error in getPolySyllWords>getSyllable (line 38)
InnerCode = InnerCode{1};
Error in getPolySyllWords>@(x)getSyllable(x)
Error in getPolySyllWords (line 8)
TextSyl = cellfun(@(x) getSyllable(x), TextCell);

Я получаю выше ошибки

function Syl = getSyllable(Word)
   if nargin == 0
       Word = input('What word do you want? ', 's');
   end
  if isempty(Word)
    Syl = 0;
    return
  end
Word = strrep(Word, ' ', '');

try
   Txt = webread(sprintf('http://www.dictionary.com/browse/%s?s=t', Word));
catch
    warning('Could not determine syllable for "%s". Returning 0.', Word);
    Syl = 0;
return
end

if isempty(InnerCode)
InnerCode = InnerCode{1};
CodeSrch2 = '>(?<Phonetics>[^\<]+)';
Phonetics = regexp(InnerCode, CodeSrch2, 'tokens');
Phonetics = [Phonetics{1}{:}];
else
% handle this case
Syl=1;
   return;
end

1 ответ

Решение

Проблема в том, что ваш звонок

SiteTxt = webread(sprintf('http://www.dictionary.com/browse/%s?s=t', Word));

для слова "Dr" возвращает некоторый SiteText, где тег

<span class="pron spellpron">[someResult] </span>

Вы сканируете SiteText, чтобы остаться пустым. Это в следующей строке

InnerCode = regexp(SiteTxt, CodeSrch1, 'tokens');

создает пустой массив, который вызывает ошибку "Индекс превышает размер матрицы".

Вы можете проверить это самостоятельно, введя два разных слова "доктор" и "доктор" прямо на главной странице:

Пожалуйста, добавьте в ваш код что-то вроде следующего фрагмента кода для обработки этих случаев:

if ~isempty(InnerCode)
    InnerCode = InnerCode{1};
    CodeSrch2 = '>(?<Phonetics>[^\<]+)';
    Phonetics = regexp(InnerCode, CodeSrch2, 'tokens');
    Phonetics = [Phonetics{1}{:}];
else
    % handle this case
    Syl=0;
    return;
end
Другие вопросы по тегам