Стандартизация адресов в базе данных
Работа в MS Access 2013. Есть множество мест / адресов, которые необходимо стандартизировать.
Примеры включают адреса как:
- 500 Вт Main St
- 500 West Main St
- 500 West Main Street
Вы получаете смысл.
Я рассмотрел выполнение запроса, который извлекает все записи, в которых левые (7) или что-то еще символы встречаются в базе данных более одного раза, но в этой логике есть очевидные недостатки.
Есть ли функция или запрос или что-то еще, что помогло бы мне создать список записей, адреса которых могут существовать несколько раз, в несколько разных модах?
1 ответ
Это сложный бизнес... равные части Черной Магии и Науки. Вы будете поражены только вариациями бульвара.
Вот почему я использую Google API. Это может занять много времени для начального набора данных, но только новые добавления должны быть разрешены.
Например
https://maps.googleapis.com/maps/api/geocode/json?address=500 S Main St,Providence RI 02903
возвращается, частично
"formatted_address" : "500 S Main St, Providence, RI 02903, USA"
и хорошие новости
https://maps.googleapis.com/maps/api/geocode/json?address=500 South Main Steet,Providence RI 02903
возвращает тот же форматированный адрес, что и предыдущий запрос
"formatted_address" : "500 S Main St, Providence, RI 02903, USA"
Пример VBA:
После выполнения следующего кода...
' VBA project Reference required:
' Microsoft XML, v3.0
Dim httpReq As New MSXML2.ServerXMLHTTP
httpReq.Open "GET", "https://maps.googleapis.com/maps/api/geocode/json?address=500 South Main Steet,Providence RI 02903", False
httpReq.send
Dim response As String
response = httpReq.responseText
... строковая переменная response
содержит следующие данные JSON:
{
"results" : [
{
"address_components" : [
{
"long_name" : "500",
"short_name" : "500",
"types" : [ "street_number" ]
},
{
"long_name" : "South Main Street",
"short_name" : "S Main St",
"types" : [ "route" ]
},
{
"long_name" : "Fox Point",
"short_name" : "Fox Point",
"types" : [ "neighborhood", "political" ]
},
{
"long_name" : "Providence",
"short_name" : "Providence",
"types" : [ "locality", "political" ]
},
{
"long_name" : "Providence County",
"short_name" : "Providence County",
"types" : [ "administrative_area_level_2", "political" ]
},
{
"long_name" : "Rhode Island",
"short_name" : "RI",
"types" : [ "administrative_area_level_1", "political" ]
},
{
"long_name" : "United States",
"short_name" : "US",
"types" : [ "country", "political" ]
},
{
"long_name" : "02903",
"short_name" : "02903",
"types" : [ "postal_code" ]
},
{
"long_name" : "2915",
"short_name" : "2915",
"types" : [ "postal_code_suffix" ]
}
],
"formatted_address" : "500 S Main St, Providence, RI 02903, USA",
"geometry" : {
"bounds" : {
"northeast" : {
"lat" : 41.82055829999999,
"lng" : -71.4028137
},
"southwest" : {
"lat" : 41.8204014,
"lng" : -71.40319219999999
}
},
"location" : {
"lat" : 41.8204799,
"lng" : -71.40300289999999
},
"location_type" : "ROOFTOP",
"viewport" : {
"northeast" : {
"lat" : 41.8218288302915,
"lng" : -71.40165396970851
},
"southwest" : {
"lat" : 41.8191308697085,
"lng" : -71.40435193029151
}
}
},
"partial_match" : true,
"place_id" : "ChIJicPQAT9F5IkRfq2njkYqZtE",
"types" : [ "premise" ]
}
],
"status" : "OK"
}
Ответ Джона полностью верен, я также хотел добавить, что вы можете достичь той же цели с HERE API. Вы можете сделать это бесплатно с помощью HERE Maps, и для начала вам не понадобится кредитная карта.
https://geocode.search.hereapi.com/v1/geocode?q=500 West Main Street&apiKey=YOUR_API_KEY
Возврат:
{
"items": [
{
"title": "500 W Main St, Alhambra, CA 91801-3308, United States",
"id": "here:af:streetsection:-2rEzgpCkFyX.gMQjWtV1A:CgcIBCCl6q07EAEaAzUwMChk",
"resultType": "houseNumber",
"houseNumberType": "PA",
"address": {
"label": "500 W Main St, Alhambra, CA 91801-3308, United States",
"countryCode": "USA",
"countryName": "United States",
"state": "California",
"county": "Los Angeles",
"city": "Alhambra",
"street": "W Main St",
"postalCode": "91801-3308",
"houseNumber": "500"
},
"position": {
"lat": 34.09193,
"lng": -118.13238
},
"access": [
{
"lat": 34.09241,
"lng": -118.13272
}
],
"mapView": {
"west": -118.13347,
"south": 34.09103,
"east": -118.13129,
"north": 34.09283
},
"scoring": {
"queryScore": 1.0,
"fieldScore": {
"streets": [
1.0
],
"houseNumber": 1.0
}
}
},
additional results...
Таким образом, вы можете нормализовать свои данные на основе заголовка.