Счетчик предложений из файла

Я пытаюсь сделать простую программу, которая считает слова, определенные строки и предложения. У меня есть счетчик слов, и у меня есть счетчик, который подсчитывает определенные строки, но я не могу понять, как считать предложения, поскольку, по сути, если я считаю все десятичные дроби, то что, если существует более одного " .".

пока это мой код..

int count = 0;
// while there is something in the file, keep reading and counting
while (inputFile.hasNext()) {
   String token = inputFile.next();
   count++;
}

int letters = 0;
Scanner scanner = new Scanner(file);
while (scanner.hasNextLine()) {
    String nextToken = scanner.next();
    if (nextToken.equalsIgnoreCase("for"))
    {
    letters++;
    }

}

1 ответ

Здесь есть несколько ответов - простой синтаксический анализатор предложений Java с использованием StringTokenizer, regex, BreakIterator, что угодно, но реальная история такова: идентификация предложений не является тривиальной задачей, если вы действительно хотите их найти. Просто подумайте над реальным длинным предложением, используя кавычки и числа вместе.

Существует несколько библиотек, от Sentence Parser до NLP, более сложных, таких как lingpipe, weka и gate. (см. http://www.quora.com/What-are-the-best-Java-open-source-NLP-toolkits)

Все зависит от того, насколько глубоко вы хотите пойти на это.

Другие вопросы по тегам