Соответствие строки / поиск для python
Я пытаюсь почистить и очистить данные Википедии. У меня есть поле данных, которое содержит размеры, как показано ниже.
["112 x 76 yards (102.4m x 69.4m)", "104.5 x 70.3 m", "107m x 72m",
"109×73 yds / 100×67 m", "{{convert|105|x|68|m|yd|1}}", "100 metres by 70 metres"]
Извлечь размеры достаточно просто, но извлечь единицу довольно сложно, учитывая, сколько существует вариантов записей. Каков наилучший способ приблизиться к этому?
Я начал с использованием;
"(\d+\.?\d*)"
Что должно извлечь все размеры, я собирался сохранить только первые 2 числовых совпадения, сохранить первое совпадение единицы измерения ("m", "meter", "метров", "y", "ярд", "yds"). ',' yd ',' ft '.....) и тогда я смогу преобразовать все в метры позже.
Я просто не уверен, как бы я сохранил первый матч.