Извлечение приговора из абзаца
С помощью strtok
каждый пункт в параграфе можно получить индивидуально.
Я хочу захватить все предложения на странице индивидуально для обработки их отдельно.
Одним из решений является сохранение цикла и проверка каждого символа, если он .
тогда я считаю, что предложение закончено, поэтому сохраните его в некоторой структуре данных. I dont know which data structure is best suitable to store this
, Массив или вектор?
Есть ли какой-либо другой лучший способ или какой-нибудь класс C++ для этого?
ОБНОВИТЬ
Позже я хочу выполнить действие по отрицаниям в предложении. Средства с учетом not
, no
, nope
такие ключевые слова. если not
+ negative word
затем принять это как + ве слово.
1 ответ
Поскольку вы используете C++, лучшей структурой данных для хранения строк является std::string
учебный класс. Храните несколько строк в std::vector<std::string>
, Кстати не используйте strtok
использовать std::getline
вместо.
Но поскольку вы занимаетесь манипулированием текстом и, возможно, манипулированием текстом на международном уровне, вам следует взглянуть на библиотеку ICU. В этом случае icu::BreakIterator::createSentenceInstance
особенно.