Как извлечь денежную стоимость из "кассовой" строки в IMDbPY

Я хотел бы извлечь денежную ценность при использовании IMDbPY для извлечения данных из IMDB.

Моя проблема в том, что IMDbPY возвращает результаты в следующем формате, что является строкой Unicode:

In : movie['business']['gross'][0]
Out: u'$134,966,411 (USA) (11 May 1997)'

Кроме того, дата иногда присутствует, иногда нет.

Можете ли вы помочь мне, как извлечь число из этой строки, без случайного распознавания части дата / год?

Символ валюты и код страны не важны.

1 ответ

Решение

re.match с этим шаблоном:

r"\$([1-9][0-9,]+)"
Другие вопросы по тегам