Замена всех не алфавитно-цифровых символов пустыми строками

Question

Замена всех не алфавитно-цифровых символов пустыми строками

Я пытался использовать это, но не сработало

return value.replaceAll("/[^A-Za-z0-9 ]/", "");

234

java regex non-alphanumeric

Источник

user219676 26 ноя '09 в 20:28

14 ответов

Решение

Пытаться

return value.replaceAll("[^A-Za-z0-9]", "");

или же

return value.replaceAll("[\\W]|_", "");

148

Источник

user42902 26 ноя '09 в 20:33

Вы должны знать, что [^a-zA-Z] заменит символы, не являющиеся самими собой в диапазоне символов AZ/az. Это означает, что специальные символы, такие как é, ß и т. д. или кириллические символы и т. д. будут удалены.

Если замена этих символов нежелательна, используйте вместо этого заранее определенные классы символов:

 someString.replaceAll("[^\\p{IsAlphabetic}^\\p{IsDigit}]", "");

PS: \p{Alnum} не достигает этого эффекта, он действует так же, как [A-Za-z0-9],

91

Источник

user44963 17 сен '15 в 10:25

return value.replaceAll("[^A-Za-z0-9 ]", "");

Это оставит пробелы нетронутыми. Я полагаю, это то, что вы хотите. В противном случае удалите пробел из регулярного выражения.

64

Источник

user3474 26 ноя '09 в 20:31

Вы также можете попробовать это более простое регулярное выражение:

 str = str.replaceAll("\\P{Alnum}", "");

23

Источник

user1154654 06 авг '13 в 12:17

Решение:

value.replaceAll("[^A-Za-z0-9]", "")

Объяснение:

[^abc] Когда карета ^ появляется как первый символ в квадратных скобках, это отрицает образец. Этот шаблон соответствует любому символу, кроме a или b или c.

Глядя на ключевое слово как две функции:

[(Pattern)] = match(Pattern)
[^(Pattern)] = notMatch(Pattern)

Более того, в отношении шаблона:

A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=0 = all characters included from 0 to 9

Поэтому он заменит все символы, НЕ включенные в шаблон

13

Источник

user5265058 21 ноя '18 в 12:07

Регулярные выражения Java не требуют, чтобы вы поставили косую черту (/) или любой другой разделитель вокруг регулярного выражения, в отличие от других языков, таких как Perl, например.

12

Источник

user573 26 ноя '09 в 20:39

Я сделал этот метод для создания имен файлов:

public static String safeChar(String input)
{
    char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
    char[] charArray = input.toString().toCharArray();
    StringBuilder result = new StringBuilder();
    for (char c : charArray)
    {
        for (char a : allowed)
        {
            if(c==a) result.append(a);
        }
    }
    return result.toString();
}

8

Источник

user219758 27 ноя '09 в 02:08

Если вы хотите также разрешить алфавитно-цифровые символы, которые не относятся к набору символов ascii, как, например, немецкие умлауты, вы можете использовать следующее решение:

 String value = "your value";

 // this could be placed as a static final constant, so the compiling is only done once
 Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);

 value = pattern.matcher(value).replaceAll("");

Обратите внимание, что использование флага UNICODE_CHARACTER_CLASS может повлиять на снижение производительности (см. Javadoc этого флага)

3

Источник

user8578684 24 май '18 в 10:18

Используя Guava, вы можете легко комбинировать различные типы критериев. Для вашего конкретного решения вы можете использовать:

value = CharMatcher.inRange('0', '9')
        .or(CharMatcher.inRange('a', 'z')
        .or(CharMatcher.inRange('A', 'Z'))).retainFrom(value)

2

Источник

user3817152 04 окт '18 в 07:45

CharMatcher от Guava предлагает краткое решение:

output = CharMatcher.javaLetterOrDigit().retainFrom(input);

1

Источник

user1694265 28 окт '19 в 10:56

public static void main(String[] args) {
    String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";

    System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));

}

вывод: ChlamydiasppIgGIgMIgAAbs8006

Github: https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java

1

Источник

user8303977 23 авг '17 в 15:21

Простой метод:

public boolean isBlank(String value) {
    return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}

public String normalizeOnlyLettersNumbers(String str) {
    if (!isBlank(str)) {
        return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
    } else {
        return "";
    }
}

1

Источник

user5004526 01 ноя '16 в 19:36

Дартс

Если вы попробовали это, и это не сработало..

value.replaceAll("[^A-Za-z0-9]", "");

Просто используйте RegExp следующим образом:

value.replaceAll(RegExp("[^A-Za-z0-9]"), "");

0

Источник

user7382218 15 ноя '22 в 23:32

Другие вопросы по тегам java regex non-alphanumeric

user208013 26 ноя '09 в 20:30 2009-11-26 20:30 · Accepted Answer · 2009-11-26 20:30

Использование [^A-Za-z0-9],

Примечание: убрал пробел, поскольку он обычно не считается буквенно-цифровым.

298

Источник

user208013 26 ноя '09 в 20:30