Как преобразовать строку валюты в число с плавающей запятой в Python?

У меня есть несколько строк, представляющих числа с определенным форматом валюты, например:

money="$6,150,593.22"

Я хочу преобразовать эту строку в число

6150593.22

Каков наилучший способ достичь этого?

10 ответов

Решение

Попробуй это:

from re import sub
from decimal import Decimal

money = '$6,150,593.22'
value = Decimal(sub(r'[^\d.]', '', money))

Это имеет некоторые преимущества, так как использует Decimal вместо float (что лучше для представления валюты), а также позволяет избежать проблем с локализацией, не жестко кодируя конкретный символ валюты.

Если ваша локаль установлена ​​правильно, вы можете использовать locale.atof, но вам все равно нужно будет убрать '$' вручную:

>>> import locale
>>> locale.setlocale(locale.LC_ALL, 'en_US.UTF8')
'en_US.UTF8'
>>> money = "$6,150,593.22"
>>> locale.atof(money.strip("$"))
6150593.2199999997

Я нашел babel пакет очень полезен для обхода

Это позволяет легко разобрать число в локализованном представлении:

>>> babel.numbers.parse_decimal('1,024.64', locale='en')                                                                                                                           
Decimal('1024.64')
>>> babel.numbers.parse_decimal('1.024,64', locale='de')
Decimal('1024.64')
>>>

Ты можешь использовать babel.numbers.get_currency_symbol('USD') удалить пре / суффиксы без их жесткого кодирования.

Hth, DTK

Для решения без жесткого кодирования валютной позиции или символа:

raw_price = "17,30 €"
import locale
locale.setlocale(locale.LC_ALL, 'fr_FR.UTF8')
conv = locale.localeconv()
raw_numbers = raw_price.strip(conv['currency_symbol'].decode('utf-8'))
amount = locale.atof(raw_numbers)

Расширение для включения отрицательных чисел в скобки:

In [1]: import locale, string

In [2]: from decimal import Decimal

In [3]: n = ['$1,234.56','-$1,234.56','($1,234.56)', '$ -1,234.56']

In [4]: tbl = string.maketrans('(','-')

In [5]: %timeit -n10000 [locale.atof( x.translate(tbl, '$)')) for x in n]
10000 loops, best of 3: 31.9 æs per loop

In [6]: %timeit -n10000 [Decimal( x.translate(tbl, '$,)')) for x in n]
10000 loops, best of 3: 21 æs per loop

In [7]: %timeit -n10000 [float( x.replace('(','-').translate(None, '$,)')) for x in n]
10000 loops, best of 3: 3.49 æs per loop

In [8]: %timeit -n10000 [float( x.translate(tbl, '$,)')) for x in n]
10000 loops, best of 3: 2.19 æs per loop

Обратите внимание, что запятые должны быть удалены из float()/Decimal(). Либо replace (), либо translate () с таблицей перевода можно использовать для преобразования открытия (в -, переводить немного быстрее. Float () быстрее всего в 10-15 раз, но ему не хватает точности и могут возникнуть проблемы с локалью. Decimal() имеет точность и на 50% быстрее, чем locale.atof (), но также имеет проблемы с локалью. locale.atof () - самый медленный, но самый общий.

Расширение ответа @Andrew Clark

Для других локалей, отличных от en_US:

      >>> import re
>>> import locale
>>> locale.setlocale(locale.LC_NUMERIC, 'pt_BR.UTF8') # this is for atof()
'pt_BR.UTF8'
>>> locale.setlocale(locale.LC_MONETARY, 'pt_BR.UTF8') # this is for currency()
'pt_BR.UTF8'
>>> curr = locale.currency(6150593.22, grouping = True)
>>> curr
'R$ 6.150.593,22'
>>> re.sub('[^(\d,.)]', '', curr)
'15,00'
>>> locale.atof(re.sub('[^(\d,.)]', '', curr))
6150593.22
>>> 6150593.22 == locale.atof(re.sub('[^(\d,.)]', '', locale.currency(6150593.22, grouping = True)))
True

Обязательное напоминание: подходящий тип Python для валюты — Decimal, а не с плавающей запятой.

Я сделал эту функцию несколько лет назад, чтобы решить ту же проблему.

def money(number):
    number = number.strip('$')
    try:
        [num,dec]=number.rsplit('.')
        dec = int(dec)
        aside = str(dec)
        x = int('1'+'0'*len(aside))
        price = float(dec)/x
        num = num.replace(',','')
        num = int(num)
        price = num + price
    except:
        price = int(number)
    return price

Я предоставлю свое решение, надеясь, что оно поможет тому, кто сталкивается с проблемами не только ,но и ..

      def process_currency_adaptive(currency_string: str, decimal_sep_char: str) -> float:
    """
    Converts the currency string to common float format:
        Format: 
            ######.### 
        Example: 
            6150593.22
    """
    # Get rid of currency symbol
    currency_symbols = ["$", "€", "£", "₺"]
    
    # Replace any occurrence of currency symbol with empty string
    for symbol in currency_symbols:
        currency_string = currency_string.replace(symbol, "")
    
    
    if decimal_sep_char == ",":
        triple_sep_char = "."
    elif decimal_sep_char == ".":
        triple_sep_char = ","
    else:
        raise ValueError("Invalid decimal separator character: {}".format(decimal_sep_char))

    # Get rid of the triple separator
    currency_string = currency_string.replace(triple_sep_char, "")
    
    # There should be only one decimal_sep_char.
    if currency_string.count(decimal_sep_char) != 1:
        print("Error: Invalid currency format with value: {}".format(currency_string))
        raise ValueError
    
    return float(currency_string.replace(decimal_sep_char, "."))

# test process_currency
print(process_currency_adaptive("942,695", decimal_sep_char=","))  # 942.695
print(process_currency_adaptive("$6,150,593.22", decimal_sep_char="."))  # 6150593.22        

Эта функция конвертирует турецкий формат цены в десятичное число.

money = '1.234,75'
def make_decimal(string):
    result = 0
    if string:
        [num, dec] = string.rsplit(',')
        result += int(num.replace('.', ''))
        result += (int(dec) / 100)
    return result
print(make_decimal(money))
1234.75

Самый простой способ, который я нашел, без жесткого кодирования при обнаружении валюты:

>>> money="$6,150,593.22"
>>> amount = float("".join(d for d in money if d.isdigit()))
>>> amount
615059322.0

credit: https://www.reddit.com/r/learnpython/comments/2248mp/how_to_format_currency_without_currency_sign/cgjd1o4?utm_source=share&utm_medium=web2x
Другие вопросы по тегам