Соответствие строки / поиск для python

Я пытаюсь почистить и очистить данные Википедии. У меня есть поле данных, которое содержит размеры, как показано ниже.

["112 x 76 yards (102.4m x 69.4m)", "104.5 x 70.3 m", "107m x 72m", 
 "109×73 yds / 100×67 m", "{{convert|105|x|68|m|yd|1}}", "100 metres by 70 metres"]

Извлечь размеры достаточно просто, но извлечь единицу довольно сложно, учитывая, сколько существует вариантов записей. Каков наилучший способ приблизиться к этому?

Я начал с использованием;

"(\d+\.?\d*)"

Что должно извлечь все размеры, я собирался сохранить только первые 2 числовых совпадения, сохранить первое совпадение единицы измерения ("m", "meter", "метров", "y", "ярд", "yds"). ',' yd ',' ft '.....) и тогда я смогу преобразовать все в метры позже.

Я просто не уверен, как бы я сохранил первый матч.

0 ответов

Другие вопросы по тегам