В Clojure, как я могу преобразовать строку в число?
У меня есть различные строки, некоторые как "45", некоторые как "45px". Как мне конвертировать оба этих числа в число 45?
11 ответов
Это будет работать на 10px
или же px10
(defn parse-int [s]
(Integer. (re-find #"\d+" s )))
он будет анализировать только первую непрерывную цифру,
user=> (parse-int "10not123")
10
user=> (parse-int "abc10def11")
10
Новый ответ
Мне больше нравится ответ снобота. Использование метода Java проще и надежнее, чем использование read-string для этого простого варианта использования. Я сделал пару небольших изменений. Поскольку автор не исключил отрицательных чисел, я настроил его, чтобы разрешить отрицательные числа. Я также сделал это так, что требуется номер, чтобы начать в начале строки.
(defn parse-int [s]
(Integer/parseInt (re-find #"\A-?\d+" s)))
Кроме того, я обнаружил, что Integer / parseInt анализирует как десятичное, когда не задано основание, даже если есть начальные нули.
Старый ответ
Во-первых, проанализировать только целое число (так как это хит на Google, и это хорошая справочная информация):
Вы можете использовать читателя:
(read-string "9") ; => 9
Вы можете проверить, что это число после его прочтения:
(defn str->int [str] (if (number? (read-string str))))
Я не уверен, что читателю clojure можно доверять пользовательскому вводу, чтобы вы могли проверить и его чтение:
(defn str->int [str] (if (re-matches (re-pattern "\\d+") str) (read-string str)))
Я думаю, что предпочитаю последнее решение.
А теперь к вашему конкретному вопросу. Разобрать то, что начинается с целого числа, например 29px
:
(read-string (second (re-matches (re-pattern "(\\d+).*") "29px"))) ; => 29
(defn parse-int [s]
(Integer. (re-find #"[0-9]*" s)))
user> (parse-int "10px")
10
user> (parse-int "10")
10
Для меня это работает гораздо лучше.
(чтение строки "123")
=> 123
AFAIK there's no standard solution for your problem. Я думаю что-то вроде следующего, который использует clojure.contrib.str-utils2/replace
, должно помочь:
(defn str2int [txt]
(Integer/parseInt (replace txt #"[a-zA-Z]" "")))
Это не идеально, но вот что-то с filter
, Character/isDigit
а также Integer/parseInt
, Он не будет работать для чисел с плавающей запятой и завершится ошибкой, если на входе нет цифр, так что вам, вероятно, следует его очистить. Я надеюсь, что есть более хороший способ сделать это, не задействуя столько Java.
user=> (defn strToInt [x] (Integer/parseInt (apply str (filter #(Character/isDigit %) x))))
#'user/strToInt
user=> (strToInt "45px")
45
user=> (strToInt "45")
45
user=> (strToInt "a")
java.lang.NumberFormatException: For input string: "" (NO_SOURCE_FILE:0)
Для всех, кто хочет преобразовать более обычный строковый литерал в число, то есть строку, в которой нет других нечисловых символов. Это два лучших подхода:
Использование взаимодействия с Java:
(Long/parseLong "333")
(Float/parseFloat "333.33")
(Double/parseDouble "333.3333333333332")
(Integer/parseInt "-333")
(Integer/parseUnsignedInt "333")
(BigInteger. "3333333333333333333333333332")
(BigDecimal. "3.3333333333333333333333333332")
(Short/parseShort "400")
(Byte/parseByte "120")
Это позволяет вам точно контролировать тип, в котором вы хотите проанализировать число, когда это важно для вашего варианта использования.
Используя программу чтения Clojure EDN:
(require '[clojure.edn :as edn])
(edn/read-string "333")
В отличие от использования read-string
от clojure.core
что небезопасно использовать с ненадежным вводом, edn/read-string
безопасно работать с ненадежным вводом, таким как ввод пользователя.
Это часто более удобно, чем взаимодействие с Java, если вам не нужно иметь конкретный контроль над типами. Он может анализировать любой числовой литерал, который может анализировать Clojure, например:
;; Ratios
(edn/read-string "22/7")
;; Hexadecimal
(edn/read-string "0xff")
Полный список здесь: https://www.rubberducking.com/2019/05/clojure-for-non-clojure-programmers.html
Расширяя ответ снобота:
(defn string->integer [s]
(when-let [d (re-find #"-?\d+" s)] (Integer. d)))
Эта версия возвращает ноль, если на входе нет цифр, а не вызывает исключение.
Мой вопрос заключается в том, допустимо ли сокращать название до "str->int", или такие вещи всегда должны быть указаны полностью.
Я бы, вероятно, добавил несколько вещей к требованиям:
- Должен начинаться с цифры
- Должен терпеть пустые входы
- Допускает передачу любого объекта (toString является стандартным)
Может быть что-то вроде:
(defn parse-int [v]
(try
(Integer/parseInt (re-find #"^\d+" (.toString v)))
(catch NumberFormatException e 0)))
(parse-int "lkjhasd")
; => 0
(parse-int (java.awt.Color. 4 5 6))
; => 0
(parse-int "a5v")
; => 0
(parse-int "50px")
; => 50
и затем, возможно, бонусные баллы за то, что сделали этот мульти-метод, который учитывает предоставленное пользователем значение по умолчанию, отличное от 0.
Вопрос спрашивает о разборе строки в число.
(number? 0.5)
;;=> true
Таким образом, из вышеупомянутых десятичных чисел следует также разобрать.
Возможно, не совсем отвечая на вопрос сейчас, но для общего использования, я думаю, вы хотели бы быть строгим в отношении того, является ли это число или нет (поэтому "px" не допускается), и позволить вызывающей стороне обрабатывать не числа, возвращая nil:
(defn str->number [x]
(when-let [num (re-matches #"-?\d+\.?\d*" x)]
(try
(Float/parseFloat num)
(catch Exception _
nil))))
И если поплавки проблематичны для вашего домена вместо Float/parseFloat
положил bigdec
или что-то другое.
Также используя (re-seq)
Функция может расширять возвращаемое значение до строки, содержащей все числа, существующие во входной строке, в следующем порядке:
(defn convert-to-int [s]
(->> (re-seq #"\d" s)
(apply str)
(Integer.)))
(convert-to-int "10not123")
=> 10123
(type *1)
=> java.lang.Integer
Как насчет этого, чтобы избежать исключения для определенных строк?
(defn string-to-number [in]
(let [s (strip-whitespace in) ;; trim
f (re-find #"\d+" s)] ;; search digit else nil
(if f (Integer/parseInt f) 0))) ;; if not-nil do cast
(string-to-number "-")
(string-to-number "10")
(string-to-number "px10")
(string-to-number "1200 xr")
Для простых случаев вы можете просто использовать регулярное выражение, чтобы вытащить первую строку цифр, как указано выше.
Если у вас более сложная ситуация, вы можете использовать библиотеку InstaParse:
(ns tst.parse.demo
(:use tupelo.test)
(:require
[clojure.string :as str]
[instaparse.core :as insta]
[tupelo.core :as t] ))
(t/refer-tupelo)
(dotest
(let [abnf-src "
size-val = int / int-px
int = digits ; ex '123'
int-px = digits <'px'> ; ex '123px'
<digits> = 1*digit ; 1 or more digits
<digit> = %x30-39 ; 0-9
"
tx-map {:int (fn fn-int [& args]
[:int (Integer/parseInt (str/join args))])
:int-px (fn fn-int-px [& args]
[:int-px (Integer/parseInt (str/join args))])
:size-val identity
}
parser (insta/parser abnf-src :input-format :abnf)
instaparse-failure? (fn [arg] (= (class arg) instaparse.gll.Failure))
parse-and-transform (fn [text]
(let [result (insta/transform tx-map
(parser text))]
(if (instaparse-failure? result)
(throw (IllegalArgumentException. (str result)))
result))) ]
(is= [:int 123] (parse-and-transform "123"))
(is= [:int-px 123] (parse-and-transform "123px"))
(throws? (parse-and-transform "123xyz"))))