Стандартизация адресов в базе данных

Работа в MS Access 2013. Есть множество мест / адресов, которые необходимо стандартизировать.

Примеры включают адреса как:

  • 500 Вт Main St
  • 500 West Main St
  • 500 West Main Street

Вы получаете смысл.

Я рассмотрел выполнение запроса, который извлекает все записи, в которых левые (7) или что-то еще символы встречаются в базе данных более одного раза, но в этой логике есть очевидные недостатки.

Есть ли функция или запрос или что-то еще, что помогло бы мне создать список записей, адреса которых могут существовать несколько раз, в несколько разных модах?

1 ответ

Решение

Это сложный бизнес... равные части Черной Магии и Науки. Вы будете поражены только вариациями бульвара.

Вот почему я использую Google API. Это может занять много времени для начального набора данных, но только новые добавления должны быть разрешены.

Например

https://maps.googleapis.com/maps/api/geocode/json?address=500 S Main St,Providence RI 02903

возвращается, частично

"formatted_address" : "500 S Main St, Providence, RI 02903, USA"

и хорошие новости

https://maps.googleapis.com/maps/api/geocode/json?address=500 South Main Steet,Providence RI 02903

возвращает тот же форматированный адрес, что и предыдущий запрос

"formatted_address" : "500 S Main St, Providence, RI 02903, USA"

Пример VBA:

После выполнения следующего кода...

' VBA project Reference required:
' Microsoft XML, v3.0

Dim httpReq As New MSXML2.ServerXMLHTTP
httpReq.Open "GET", "https://maps.googleapis.com/maps/api/geocode/json?address=500 South Main Steet,Providence RI 02903", False
httpReq.send
Dim response As String
response = httpReq.responseText

... строковая переменная response содержит следующие данные JSON:

{
   "results" : [
      {
         "address_components" : [
            {
               "long_name" : "500",
               "short_name" : "500",
               "types" : [ "street_number" ]
            },
            {
               "long_name" : "South Main Street",
               "short_name" : "S Main St",
               "types" : [ "route" ]
            },
            {
               "long_name" : "Fox Point",
               "short_name" : "Fox Point",
               "types" : [ "neighborhood", "political" ]
            },
            {
               "long_name" : "Providence",
               "short_name" : "Providence",
               "types" : [ "locality", "political" ]
            },
            {
               "long_name" : "Providence County",
               "short_name" : "Providence County",
               "types" : [ "administrative_area_level_2", "political" ]
            },
            {
               "long_name" : "Rhode Island",
               "short_name" : "RI",
               "types" : [ "administrative_area_level_1", "political" ]
            },
            {
               "long_name" : "United States",
               "short_name" : "US",
               "types" : [ "country", "political" ]
            },
            {
               "long_name" : "02903",
               "short_name" : "02903",
               "types" : [ "postal_code" ]
            },
            {
               "long_name" : "2915",
               "short_name" : "2915",
               "types" : [ "postal_code_suffix" ]
            }
         ],
         "formatted_address" : "500 S Main St, Providence, RI 02903, USA",
         "geometry" : {
            "bounds" : {
               "northeast" : {
                  "lat" : 41.82055829999999,
                  "lng" : -71.4028137
               },
               "southwest" : {
                  "lat" : 41.8204014,
                  "lng" : -71.40319219999999
               }
            },
            "location" : {
               "lat" : 41.8204799,
               "lng" : -71.40300289999999
            },
            "location_type" : "ROOFTOP",
            "viewport" : {
               "northeast" : {
                  "lat" : 41.8218288302915,
                  "lng" : -71.40165396970851
               },
               "southwest" : {
                  "lat" : 41.8191308697085,
                  "lng" : -71.40435193029151
               }
            }
         },
         "partial_match" : true,
         "place_id" : "ChIJicPQAT9F5IkRfq2njkYqZtE",
         "types" : [ "premise" ]
      }
   ],
   "status" : "OK"
}

Ответ Джона полностью верен, я также хотел добавить, что вы можете достичь той же цели с HERE API. Вы можете сделать это бесплатно с помощью HERE Maps, и для начала вам не понадобится кредитная карта.

https://geocode.search.hereapi.com/v1/geocode?q=500 West Main Street&apiKey=YOUR_API_KEY

Возврат:

{
    "items": [
        {
            "title": "500 W Main St, Alhambra, CA 91801-3308, United States",
            "id": "here:af:streetsection:-2rEzgpCkFyX.gMQjWtV1A:CgcIBCCl6q07EAEaAzUwMChk",
            "resultType": "houseNumber",
            "houseNumberType": "PA",
            "address": {
                "label": "500 W Main St, Alhambra, CA 91801-3308, United States",
                "countryCode": "USA",
                "countryName": "United States",
                "state": "California",
                "county": "Los Angeles",
                "city": "Alhambra",
                "street": "W Main St",
                "postalCode": "91801-3308",
                "houseNumber": "500"
            },
            "position": {
                "lat": 34.09193,
                "lng": -118.13238
            },
            "access": [
                {
                    "lat": 34.09241,
                    "lng": -118.13272
                }
            ],
            "mapView": {
                "west": -118.13347,
                "south": 34.09103,
                "east": -118.13129,
                "north": 34.09283
            },
            "scoring": {
                "queryScore": 1.0,
                "fieldScore": {
                    "streets": [
                        1.0
                    ],
                    "houseNumber": 1.0
                }
            }
        },
        additional results...

Таким образом, вы можете нормализовать свои данные на основе заголовка.

Другие вопросы по тегам