В Clojure, как я могу преобразовать строку в число?

У меня есть различные строки, некоторые как "45", некоторые как "45px". Как мне конвертировать оба этих числа в число 45?

11 ответов

Решение

Это будет работать на 10px или же px10

(defn parse-int [s]
   (Integer. (re-find  #"\d+" s )))

он будет анализировать только первую непрерывную цифру,

user=> (parse-int "10not123")
10
user=> (parse-int "abc10def11")
10

Новый ответ

Мне больше нравится ответ снобота. Использование метода Java проще и надежнее, чем использование read-string для этого простого варианта использования. Я сделал пару небольших изменений. Поскольку автор не исключил отрицательных чисел, я настроил его, чтобы разрешить отрицательные числа. Я также сделал это так, что требуется номер, чтобы начать в начале строки.

(defn parse-int [s]
  (Integer/parseInt (re-find #"\A-?\d+" s)))

Кроме того, я обнаружил, что Integer / parseInt анализирует как десятичное, когда не задано основание, даже если есть начальные нули.

Старый ответ

Во-первых, проанализировать только целое число (так как это хит на Google, и это хорошая справочная информация):

Вы можете использовать читателя:

(read-string "9") ; => 9

Вы можете проверить, что это число после его прочтения:

(defn str->int [str] (if (number? (read-string str))))

Я не уверен, что читателю clojure можно доверять пользовательскому вводу, чтобы вы могли проверить и его чтение:

(defn str->int [str] (if (re-matches (re-pattern "\\d+") str) (read-string str)))

Я думаю, что предпочитаю последнее решение.

А теперь к вашему конкретному вопросу. Разобрать то, что начинается с целого числа, например 29px :

(read-string (second (re-matches (re-pattern "(\\d+).*") "29px"))) ; => 29
(defn parse-int [s]
  (Integer. (re-find #"[0-9]*" s)))

user> (parse-int "10px")
10
user> (parse-int "10")
10

Для меня это работает гораздо лучше.

(чтение строки "123")

=> 123

AFAIK there's no standard solution for your problem. Я думаю что-то вроде следующего, который использует clojure.contrib.str-utils2/replace, должно помочь:

(defn str2int [txt]
  (Integer/parseInt (replace txt #"[a-zA-Z]" "")))

Это не идеально, но вот что-то с filter, Character/isDigit а также Integer/parseInt, Он не будет работать для чисел с плавающей запятой и завершится ошибкой, если на входе нет цифр, так что вам, вероятно, следует его очистить. Я надеюсь, что есть более хороший способ сделать это, не задействуя столько Java.

user=> (defn strToInt [x] (Integer/parseInt (apply str (filter #(Character/isDigit %) x))))
#'user/strToInt
user=> (strToInt "45px")
45
user=> (strToInt "45")
45
user=> (strToInt "a")
java.lang.NumberFormatException: For input string: "" (NO_SOURCE_FILE:0)

Для всех, кто хочет преобразовать более обычный строковый литерал в число, то есть строку, в которой нет других нечисловых символов. Это два лучших подхода:

Использование взаимодействия с Java:

(Long/parseLong "333")
(Float/parseFloat "333.33")
(Double/parseDouble "333.3333333333332")
(Integer/parseInt "-333")
(Integer/parseUnsignedInt "333")
(BigInteger. "3333333333333333333333333332")
(BigDecimal. "3.3333333333333333333333333332")
(Short/parseShort "400")
(Byte/parseByte "120")

Это позволяет вам точно контролировать тип, в котором вы хотите проанализировать число, когда это важно для вашего варианта использования.

Используя программу чтения Clojure EDN:

(require '[clojure.edn :as edn])
(edn/read-string "333")

В отличие от использования read-string от clojure.core что небезопасно использовать с ненадежным вводом, edn/read-string безопасно работать с ненадежным вводом, таким как ввод пользователя.

Это часто более удобно, чем взаимодействие с Java, если вам не нужно иметь конкретный контроль над типами. Он может анализировать любой числовой литерал, который может анализировать Clojure, например:

;; Ratios
(edn/read-string "22/7")
;; Hexadecimal
(edn/read-string "0xff")

Полный список здесь: https://www.rubberducking.com/2019/05/clojure-for-non-clojure-programmers.html

Расширяя ответ снобота:

(defn string->integer [s] 
  (when-let [d (re-find #"-?\d+" s)] (Integer. d)))

Эта версия возвращает ноль, если на входе нет цифр, а не вызывает исключение.

Мой вопрос заключается в том, допустимо ли сокращать название до "str->int", или такие вещи всегда должны быть указаны полностью.

Я бы, вероятно, добавил несколько вещей к требованиям:

  • Должен начинаться с цифры
  • Должен терпеть пустые входы
  • Допускает передачу любого объекта (toString является стандартным)

Может быть что-то вроде:

(defn parse-int [v] 
   (try 
     (Integer/parseInt (re-find #"^\d+" (.toString v))) 
     (catch NumberFormatException e 0)))

(parse-int "lkjhasd")
; => 0
(parse-int (java.awt.Color. 4 5 6))
; => 0
(parse-int "a5v")
; => 0
(parse-int "50px")
; => 50

и затем, возможно, бонусные баллы за то, что сделали этот мульти-метод, который учитывает предоставленное пользователем значение по умолчанию, отличное от 0.

Вопрос спрашивает о разборе строки в число.

(number? 0.5)
;;=> true

Таким образом, из вышеупомянутых десятичных чисел следует также разобрать.

Возможно, не совсем отвечая на вопрос сейчас, но для общего использования, я думаю, вы хотели бы быть строгим в отношении того, является ли это число или нет (поэтому "px" не допускается), и позволить вызывающей стороне обрабатывать не числа, возвращая nil:

(defn str->number [x]
  (when-let [num (re-matches #"-?\d+\.?\d*" x)]
    (try
      (Float/parseFloat num)
      (catch Exception _
        nil))))

И если поплавки проблематичны для вашего домена вместо Float/parseFloat положил bigdec или что-то другое.

Также используя (re-seq) Функция может расширять возвращаемое значение до строки, содержащей все числа, существующие во входной строке, в следующем порядке:

(defn convert-to-int [s] (->> (re-seq #"\d" s) (apply str) (Integer.)))

(convert-to-int "10not123") => 10123

(type *1) => java.lang.Integer

Как насчет этого, чтобы избежать исключения для определенных строк?

(defn string-to-number [in]
  (let [s (strip-whitespace in)      ;; trim
        f (re-find #"\d+" s)]        ;; search digit else nil
    (if f (Integer/parseInt f) 0)))  ;; if not-nil do cast

(string-to-number "-")
(string-to-number "10")
(string-to-number "px10")
(string-to-number "1200 xr")

Для простых случаев вы можете просто использовать регулярное выражение, чтобы вытащить первую строку цифр, как указано выше.

Если у вас более сложная ситуация, вы можете использовать библиотеку InstaParse:

(ns tst.parse.demo
  (:use tupelo.test)
  (:require
    [clojure.string :as str]
    [instaparse.core :as insta]
    [tupelo.core :as t] ))
(t/refer-tupelo)

(dotest
  (let [abnf-src            "
size-val      = int / int-px
int           = digits          ; ex '123'
int-px        = digits <'px'>   ; ex '123px'
<digits>      = 1*digit         ; 1 or more digits
<digit>       = %x30-39         ; 0-9
"
    tx-map        {:int      (fn fn-int [& args]
                               [:int (Integer/parseInt (str/join args))])
                   :int-px   (fn fn-int-px [& args]
                               [:int-px (Integer/parseInt (str/join args))])
                   :size-val identity
                  }

    parser              (insta/parser abnf-src :input-format :abnf)
    instaparse-failure? (fn [arg] (= (class arg) instaparse.gll.Failure))
    parse-and-transform (fn [text]
                          (let [result (insta/transform tx-map
                                         (parser text))]
                            (if (instaparse-failure? result)
                              (throw (IllegalArgumentException. (str result)))
                              result)))  ]
  (is= [:int 123]     (parse-and-transform "123"))
  (is= [:int-px 123]  (parse-and-transform "123px"))
  (throws?            (parse-and-transform "123xyz"))))
Другие вопросы по тегам