Как проверить, содержит ли строка подстроку в Bash
У меня есть строка в Bash:
string="My string"
Как я могу проверить, содержит ли она другую строку?
if [ $string ?? 'foo' ]; then
echo "It's there!"
fi
куда ??
мой неизвестный оператор. Я использую эхо и grep
?
if echo "$string" | grep 'foo'; then
echo "It's there!"
fi
Это выглядит немного неуклюже.
30 ответов
Вы также можете использовать ответ Маркуса (* подстановочные знаки) вне оператора case, если вы используете двойные скобки:
string='My long string'
if [[ $string == *"My long"* ]]; then
echo "It's there!"
fi
Обратите внимание, что пробелы в строке иглы должны быть помещены между двойными кавычками, и *
подстановочные знаки должны быть снаружи.
Если вы предпочитаете подход регулярных выражений:
string='My string';
if [[ $string =~ .*My.* ]]
then
echo "It's there!"
fi
Я не уверен в использовании оператора if, но вы можете получить аналогичный эффект с помощью оператора case:
case "$string" in
*foo*)
# Do stuff
;;
esac
Совместимый ответ
Поскольку уже есть много ответов, использующих специфичные для Bash функции, есть способ работать с более слабыми оболочками, такими как busybox:
[ -z "${string##*$reqsubstr*}" ]
На практике это может дать:
string='echo "My string"'
for reqsubstr in 'o "M' 'alt' 'str';do
if [ -z "${string##*$reqsubstr*}" ] ;then
echo "String '$string' contain substring: '$reqsubstr'."
else
echo "String '$string' don't contain substring: '$reqsubstr'."
fi
done
Это было проверено в bash, dash, ksh и ash (busybox), и результат всегда:
String 'echo "My string"' contain substring: 'o "M'.
String 'echo "My string"' don't contain substring: 'alt'.
String 'echo "My string"' contain substring: 'str'.
В одну функцию
По словам @EeroAaltonen, здесь есть версия того же демо, протестированная под теми же оболочками:
myfunc() {
reqsubstr="$1"
shift
string="$@"
if [ -z "${string##*$reqsubstr*}" ] ;then
echo "String '$string' contain substring: '$reqsubstr'.";
else
echo "String '$string' don't contain substring: '$reqsubstr'."
fi
}
Затем:
$ myfunc 'o "M' 'echo "My String"'
String 'echo "My String"' contain substring 'o "M'.
$ myfunc 'alt' 'echo "My String"'
String 'echo "My String"' don't contain substring 'alt'.
Обратите внимание: вы должны избегать или заключать двойные кавычки и / или двойные кавычки:
$ myfunc 'o "M' echo "My String"
String 'echo My String' don't contain substring: 'o "M'.
$ myfunc 'o "M' echo \"My String\"
String 'echo "My String"' contain substring: 'o "M'.
Простая функция
Это было проверено в busybox, dash и, конечно, bash:
stringContain() { [ -z "${2##*$1*}" ]; }
Это все, ребята!
То теперь:
$ if stringContain 'o "M3' 'echo "My String"';then echo yes;else echo no;fi
no
$ if stringContain 'o "M' 'echo "My String"';then echo yes;else echo no;fi
yes
... Или если отправленная строка может быть пустой, как указано @Sjlver, функция станет такой:
stringContain() { [ -z "${2##*$1*}" ] && [ -z "$1" -o -n "$2" ]; }
или в соответствии с предложением Адриана Гюнтера, избегая -o
переключатели на:
stringContain() { [ -z "${2##*$1*}" ] && { [ -z "$1" ] || [ -n "$2" ] ;} ; }
С пустыми строками:
$ if stringContain '' ''; then echo yes; else echo no; fi
yes
$ if stringContain 'o "M' ''; then echo yes; else echo no; fi
no
Вы должны помнить, что сценарии оболочки - это не столько язык, сколько набор команд. Инстинктивно вы думаете, что этот "язык" требует от вас следовать if
с [
или [[
, Обе эти команды - просто команды, которые возвращают состояние выхода, указывающее на успех или неудачу (как и любая другая команда). По этой причине я бы использовал grep
и не [
команда.
Просто делать:
if grep -q foo <<<"$string"; then
echo "It's there"
fi
Теперь, когда вы думаете о if
как проверка состояния выхода команды, которая следует за ней (завершается точкой с запятой). Почему бы не пересмотреть источник строки, которую вы тестируете?
## Instead of this
filetype="$(file -b "$1")"
if grep -q "tar archive" <<<"$filetype"; then
#...
## Simply do this
if file -b "$1" | grep -q "tar archive"; then
#...
-q
опция заставляет grep ничего не выводить, так как нам нужен только код возврата. <<<
заставляет оболочку развернуть следующее слово и использовать его в качестве входных данных для команды, однострочной версии <<
здесь документ (я не уверен, является ли это стандартным или bashism).
Принятый ответ лучше, но поскольку есть несколько способов сделать это, вот другое решение:
if [ "$string" != "${string/foo/}" ]; then
echo "It's there!"
fi
${var/search/replace}
является $var
с первым экземпляром search
заменен на replace
, если он найден (не меняется $var
). Если вы попытаетесь заменить foo
ничем, и строка изменилась, то, очевидно, foo
был найден.
Таким образом, есть много полезных решений вопроса - но какой из них быстрее / использует меньше всего ресурсов?
Повторные тесты с использованием этого кадра:
/usr/bin/time bash -c 'a=two;b=onetwothree; x=100000; while [ $x -gt 0 ]; do TEST ; x=$(($x-1)); done'
Замена TEST каждый раз:
[[ $b =~ $a ]] 2.92user 0.06system 0:02.99elapsed 99%CPU
[ "${b/$a//}" = "$b" ] 3.16user 0.07system 0:03.25elapsed 99%CPU
[[ $b == *$a* ]] 1.85user 0.04system 0:01.90elapsed 99%CPU
case $b in *$a):;;esac 1.80user 0.02system 0:01.83elapsed 99%CPU
doContain $a $b 4.27user 0.11system 0:04.41elapsed 99%CPU
(doContain был в ответе Ф. Хури)
И для хихиканья:
echo $b|grep -q $a 12.68user 30.86system 3:42.40elapsed 19%CPU !ouch!
Таким образом, опция простого замещения предсказуемо выигрывает, будь то в расширенном тесте или в случае. Чехол портативный.
Выпадение до 100000 greps предсказуемо больно! Старое правило об использовании внешних утилит без необходимости сохраняется.
Bash4+ примеры. Примечание: не использование кавычек вызовет проблемы, когда слова содержат пробелы и т. Д. Всегда заключайте в кавычки bash IMO.
Вот несколько примеров BASH4+:
Пример 1, проверьте "да" в строке (без учета регистра):
if [[ "${str,,}" == *"yes"* ]] ;then
Пример 2, проверьте "да" в строке (без учета регистра):
if [[ "$(echo "$str" | tr '[:upper:]' '[:lower:]')" == *"yes"* ]] ;then
Пример 3, проверьте "да" в строке (с учетом регистра):
if [[ "${str}" == *"yes"* ]] ;then
Пример 4, проверьте "да" в строке (с учетом регистра):
if [[ "${str}" =~ "yes" ]] ;then
Пример 5, точное совпадение (с учетом регистра):
if [[ "${str}" == "yes" ]] ;then
Пример 6, точное совпадение (без учета регистра):
if [[ "${str,,}" == "yes" ]] ;then
Пример 7, точное совпадение:
if [ "$a" = "$b" ] ;then
наслаждаться.
Это также работает:
if printf -- '%s' "$haystack" | egrep -q -- "$needle"
then
printf "Found needle in haystack"
fi
И отрицательный тест:
if ! printf -- '%s' "$haystack" | egrep -q -- "$needle"
then
echo "Did not find needle in haystack"
fi
Я полагаю, что этот стиль немного более классический - менее зависимый от особенностей оболочки Bash.
--
Аргумент - это паранойя POSIX, используемая для защиты от строк ввода, аналогичных опциям, таким как --abc
или же -a
,
Примечание: в тесном цикле этот код будет намного медленнее, чем при использовании внутренних функций оболочки Bash, так как один (или два) отдельных процесса будут создаваться и соединяться через каналы.
Как Павел упоминал в своем сравнении производительности:
if echo "abcdefg" | grep -q "bcdef"; then
echo "String contains is true."
else
echo "String contains is not true."
fi
Это соответствует POSIX, как ответ 'case' $ string 'in', предоставленный Маркусом, но его легче читать, чем ответ оператора case. Также обратите внимание, что это будет намного медленнее, чем использование оператора case, как указал Пол, не используйте его в цикле.
Как насчет этого:
text=" <tag>bmnmn</tag> "
if [[ "$text" =~ "<tag>" ]]; then
echo "matched"
else
echo "not matched"
fi
Принятый ответ правильный, но его трудно прочитать и понять.
Для проблем, связанных с поиском, вы всегда должны использовать $needle в идиоме $haystack.
Поскольку предлагаемая очередь редактирования заполнена , я публикую это:
haystack='There are needles here.'
if [[ "$haystack" == *"needle"* ]]; then
echo "It's there!"
fi
Этот ответ переполнения стека был единственным, кто захватил пробелы и символы тире:
# For null cmd arguments checking
to_check=' -t'
space_n_dash_chars=' -'
[[ $to_check == *"$space_n_dash_chars"* ]] && echo found
[[ $string == *foo* ]] && echo "It's there" || echo "Couldn't find"
Один:
[ $(expr $mystring : ".*${search}.*") -ne 0 ] && echo 'yes' || echo 'no'
Поскольку вопрос POSIX/BusyBox закрыт без предоставления правильного ответа (IMHO), я отправлю ответ здесь.
Самый короткий ответ:
[ ${_string_##*$_substring_*} ] || echo Substring found!
или
[ "${_string_##*$_substring_*}" ] || echo 'Substring found!'
Обратите внимание, что двойной хеш является обязательным для некоторых оболочек (ash
). Выше буду оценивать[ stringvalue ]
когда подстрока не найдена. Ошибка не возвращается. Когда подстрока найдена, результат пуст и вычисляется[ ]
. Это вызовет код ошибки 1, поскольку строка полностью заменена (из-за*
).
Самый короткий и распространенный синтаксис:
[ -z "${_string_##*$_substring_*}" ] && echo 'Substring found!'
или
[ -n "${_string_##*$_substring_*}" ] || echo 'Substring found!'
Другой:
[ "${_string_##$_substring_}" != "$_string_" ] && echo 'Substring found!'
или
[ "${_string_##$_substring_}" = "$_string_" ] || echo 'Substring found!'
Обратите внимание на единственный знак равенства!
Мне нравится Сед.
substr="foo"
nonsub="$(echo "$string" | sed "s/$substr//")"
hassub=0 ; [ "$string" != "$nonsub" ] && hassub=1
Изменить, Логика:
Используйте sed, чтобы удалить экземпляр подстроки из строки
Если новая строка отличается от старой, существует подстрока
Мой.bash_profile и как я использовал grep, если в PATH включены мои 2 папки bin, не добавляйте их
# .bash_profile
# Get the aliases and functions
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi
U=~/.local.bin:~/bin
if ! echo "$PATH" | grep -q "home"; then
export PATH=$PATH:${U}
fi
Общий пример стога сена с иголками следующий с переменными
#!/bin/bash
needle="a_needle"
haystack="a_needle another_needle a_third_needle"
if [[ $haystack == *"$needle"* ]]; then
echo "needle found"
else
echo "needle NOT found"
fi
На расширение вопроса ответили здесь /questions/38249813/kak-vyi-skazhete-soderzhit-li-stroka-druguyu-stroku-v-posix-sh/38249870#38249870
Это решение работает со специальными символами:
# contains(string, substring)
#
# Returns 0 if the specified string contains the specified substring,
# otherwise returns 1.
contains() {
string="$1"
substring="$2"
if echo "$string" | $(type -p ggrep grep | head -1) -F -- "$substring" >/dev/null; then
return 0 # $substring is in $string
else
return 1 # $substring is not in $string
fi
}
contains "abcd" "e" || echo "abcd does not contain e"
contains "abcd" "ab" && echo "abcd contains ab"
contains "abcd" "bc" && echo "abcd contains bc"
contains "abcd" "cd" && echo "abcd contains cd"
contains "abcd" "abcd" && echo "abcd contains abcd"
contains "" "" && echo "empty string contains empty string"
contains "a" "" && echo "a contains empty string"
contains "" "a" || echo "empty string does not contain a"
contains "abcd efgh" "cd ef" && echo "abcd efgh contains cd ef"
contains "abcd efgh" " " && echo "abcd efgh contains a space"
contains "abcd [efg] hij" "[efg]" && echo "abcd [efg] hij contains [efg]"
contains "abcd [efg] hij" "[effg]" || echo "abcd [efg] hij does not contain [effg]"
contains "abcd *efg* hij" "*efg*" && echo "abcd *efg* hij contains *efg*"
contains "abcd *efg* hij" "d *efg* h" && echo "abcd *efg* hij contains d *efg* h"
contains "abcd *efg* hij" "*effg*" || echo "abcd *efg* hij does not contain *effg*"
grep -q
полезно для этого.
То же самое, используя awk
:
string="unix-bash 2389"
character="@"
printf '%s' "$string" | awk -vc="$character" '{ if (gsub(c, "")) { print "Found" } else { print "Not Found" } }'
Выход:
не обнаружена
string="unix-bash 2389"
character="-"
printf '%s' "$string" | awk -vc="$character" '{ if (gsub(c, "")) { print "Found" } else { print "Not Found" } }'
Выход:
Найденный
Первоисточник: http://unstableme.blogspot.com/2008/06/bash-search-letter-in-string-awk.html
case $string in (*foo*)
# Do stuff
esac
Это тот же ответ, что и /questions/33095505/kak-proverit-soderzhit-li-stroka-podstroku-v-bash/33095537#33095537. Но простой стиль, а также POSIX-совместимый.
Я обнаружил, что эта функция нужна довольно часто, поэтому я использую самодельную функцию оболочки в моем .bashrc
вот так, что позволяет мне использовать его так часто, как мне нужно, с легко запоминающимся именем:
function stringinstring()
{
case "$2" in
*"$1"*)
return 0
;;
esac
return 1
}
Чтобы проверить, если $string1
(скажем, abc) содержится в $string2
(скажем, 123abcABC) Мне просто нужно запустить stringinstring "$string1" "$string2"
и проверьте возвращаемое значение, например
stringinstring "$str1" "$str2" && echo YES || echo NO
Точное совпадение слов:
string='My long string'
exactSearch='long'
if grep -E -q "\b${exactSearch}\b" <<<${string} >/dev/null 2>&1
then
echo "It's there"
fi
Попробуйте oobash, это библиотека строк OO-стиля для bash 4. Она поддерживает немецкие умлауты. Это написано на bash. Доступны многие функции: -base64Decode
, -base64Encode
, -capitalize
, -center
, -charAt
, -concat
, -contains
, -count
, -endsWith
, -equals
, -equalsIgnoreCase
, -reverse
, -hashCode
, -indexOf
, -isAlnum
, -isAlpha
, -isAscii
, -isDigit
, -isEmpty
, -isHexDigit
, -isLowerCase
, -isSpace
, -isPrintable
, -isUpperCase
, -isVisible
, -lastIndexOf
, -length
, -matches
, -replaceAll
, -replaceFirst
, -startsWith
, -substring
, -swapCase
, -toLowerCase
, -toString
, -toUpperCase
, -trim
, а также -zfill
,
Посмотрите на содержащийся пример:
[Desktop]$ String a testXccc
[Desktop]$ a.contains tX
true
[Desktop]$ a.contains XtX
false
Вы можете использовать логику && , чтобы быть более компактным
#!/bin/bash
# NO MATCH EXAMPLE
string="test"
[[ "$string" == *"foo"* ]] && {
echo "YES"
}
# MATCH EXAMPLE
string="tefoost"
[[ "$string" == *"foo"* ]] && {
echo "YES"
}
Я использую эту функцию (одна зависимость не включена, но очевидна). Он проходит испытания, показанные ниже. Если функция возвращает значение> 0, то строка была найдена. Вы могли бы так же легко вернуть 1 или 0 вместо этого.
function str_instr {
# Return position of ```str``` within ```string```.
# >>> str_instr "str" "string"
# str: String to search for.
# string: String to search.
typeset str string x
# Behavior here is not the same in bash vs ksh unless we escape special characters.
str="$(str_escape_special_characters "${1}")"
string="${2}"
x="${string%%$str*}"
if [[ "${x}" != "${string}" ]]; then
echo "${#x} + 1" | bc -l
else
echo 0
fi
}
function test_str_instr {
str_instr "(" "'foo@host (dev,web)'" | assert_eq 11
str_instr ")" "'foo@host (dev,web)'" | assert_eq 19
str_instr "[" "'foo@host [dev,web]'" | assert_eq 11
str_instr "]" "'foo@host [dev,web]'" | assert_eq 19
str_instr "a" "abc" | assert_eq 1
str_instr "z" "abc" | assert_eq 0
str_instr "Eggs" "Green Eggs And Ham" | assert_eq 7
str_instr "a" "" | assert_eq 0
str_instr "" "" | assert_eq 0
str_instr " " "Green Eggs" | assert_eq 6
str_instr " " " Green " | assert_eq 1
}
Вот вариант POSIX, но с:
string="My string"
pattern="string"
if [ "${string}" != "$(printf '%s' "${string}" | sed 's/'"${pattern}"'//g')" ]; then
echo "It's there!";
fi
Некоторые объяснения:
sed 's/'"${pattern}"'//g'
срывает узор${string}
. Итак, это будет выглядеть так:
if [ "My string" != "My " ];
Они не равны и этоtrue
, это означает, что шаблон был там.
Если вы используете другой шаблон, напримерpattern="foo"
, уравнение будет:
if [ "My string" != "My string" ];
Потому чтоsed
в этом случае ничего не будет разбирать и будет производитьfalse
.
Это по-прежнему выглядит неуклюже, но эта опция будет работать во многих оболочках, таких как Dash, ZSH и не только в Bash.
msg="message"
function check {
echo $msg | egrep [abc] 1> /dev/null
if [ $? -ne 1 ];
then
echo "found"
else
echo "not found"
fi
}
check
Это обнаружит любое появление a, b или c
С jq:
string='My long string'
echo $string | jq -Rr 'select(contains("long"))|"It is there"'
Самое сложное в jq — вывести одинарную кавычку:
echo $string | jq --arg quote "'" -Rr 'select(contains("long"))|"It\($quote)s there"'
Использование jq только для проверки условия:
if jq -Re 'select(contains("long"))|halt' <<< $string; then
echo "It's there!"
fi