Счетчик предложений из файла
Я пытаюсь сделать простую программу, которая считает слова, определенные строки и предложения. У меня есть счетчик слов, и у меня есть счетчик, который подсчитывает определенные строки, но я не могу понять, как считать предложения, поскольку, по сути, если я считаю все десятичные дроби, то что, если существует более одного " .".
пока это мой код..
int count = 0;
// while there is something in the file, keep reading and counting
while (inputFile.hasNext()) {
String token = inputFile.next();
count++;
}
int letters = 0;
Scanner scanner = new Scanner(file);
while (scanner.hasNextLine()) {
String nextToken = scanner.next();
if (nextToken.equalsIgnoreCase("for"))
{
letters++;
}
}
1 ответ
Здесь есть несколько ответов - простой синтаксический анализатор предложений Java с использованием StringTokenizer, regex, BreakIterator, что угодно, но реальная история такова: идентификация предложений не является тривиальной задачей, если вы действительно хотите их найти. Просто подумайте над реальным длинным предложением, используя кавычки и числа вместе.
Существует несколько библиотек, от Sentence Parser до NLP, более сложных, таких как lingpipe, weka и gate. (см. http://www.quora.com/What-are-the-best-Java-open-source-NLP-toolkits)
Все зависит от того, насколько глубоко вы хотите пойти на это.