Парсер почтовых адресов Java

В некоторой степени относится к этому вопросу, но кто-нибудь знает о парсере адресов для Java в отсутствие какого-либо конкретного ответа о QuickBooks? Что-то, что может взять неструктурированную адресную информацию и разобрать адресную строку 1, 2 и почтовый индекс штата и страны?

5 ответов

Решение

Я знаю, что веб-сервис Google Maps отлично справляется с этой задачей. Так что, если вы хотите использовать это, вы можете сэкономить много усилий.

Реальная проблема здесь заключается в том, что вам нужна всемирная база данных названий городов / стран / провинций для эффективного анализа неструктурированных адресов.

Вот как я создаю URL для использования API Карт Google в C#:

string url = "http://maps.google.com/maps/geo?key=" + HttpUtility.UrlEncode(this.apiKey) + "&sensor=false&output=xml&oe=utf8&q=" + HttpUtility.UrlEncode(location);

В SourceForge JGeocoder есть анализатор адресов, который может оказаться полезным. См. http://jgeocoder.sourceforge.net/parser.html.

Возможно, вы захотите прочитать этот вопрос переполнения стека: " Разбор пригодного адреса улицы, города, штата, почтового индекса из строки". Нет реального Java-кода для выполнения этой работы (только некоторый VB), но есть некоторое обсуждение проблемы и дополнительная информация об альтернативных упоминаниях Джона Гитзена об использовании веб-сервиса для его интерпретации.

У проекта Mural есть анализатор адресов: https://mural.dev.java.net/. Я не понял, как извлечь его из более мощного двигателя Mural, но он работает на основе очень ограниченных тестов.

См. http://www.address-parser.com/, они предлагают веб-сервис для анализа международных адресов.

Другие вопросы по тегам