Как проверить, содержит ли строка подстроку в Bash

У меня есть строка в Bash:

string="My string"

Как я могу проверить, содержит ли она другую строку?

if [ $string ?? 'foo' ]; then
  echo "It's there!"
fi

куда ?? мой неизвестный оператор. Я использую эхо и grep?

if echo "$string" | grep 'foo'; then
  echo "It's there!"
fi

Это выглядит немного неуклюже.

30 ответов

Решение

Вы также можете использовать ответ Маркуса (* подстановочные знаки) вне оператора case, если вы используете двойные скобки:

string='My long string'
if [[ $string == *"My long"* ]]; then
  echo "It's there!"
fi

Обратите внимание, что пробелы в строке иглы должны быть помещены между двойными кавычками, и * подстановочные знаки должны быть снаружи.

Если вы предпочитаете подход регулярных выражений:

string='My string';

if [[ $string =~ .*My.* ]]
then
   echo "It's there!"
fi

Я не уверен в использовании оператора if, но вы можете получить аналогичный эффект с помощью оператора case:

case "$string" in 
  *foo*)
    # Do stuff
    ;;
esac

Совместимый ответ

Поскольку уже есть много ответов, использующих специфичные для Bash функции, есть способ работать с более слабыми оболочками, такими как busybox:

[ -z "${string##*$reqsubstr*}" ]

На практике это может дать:

string='echo "My string"'
for reqsubstr in 'o "M' 'alt' 'str';do
  if [ -z "${string##*$reqsubstr*}" ] ;then
      echo "String '$string' contain substring: '$reqsubstr'."
    else
      echo "String '$string' don't contain substring: '$reqsubstr'."
    fi
  done

Это было проверено в bash, dash, ksh и ash (busybox), и результат всегда:

String 'echo "My string"' contain substring: 'o "M'.
String 'echo "My string"' don't contain substring: 'alt'.
String 'echo "My string"' contain substring: 'str'.

В одну функцию

По словам @EeroAaltonen, здесь есть версия того же демо, протестированная под теми же оболочками:

myfunc() {
    reqsubstr="$1"
    shift
    string="$@"
    if [ -z "${string##*$reqsubstr*}" ] ;then
        echo "String '$string' contain substring: '$reqsubstr'.";
      else
        echo "String '$string' don't contain substring: '$reqsubstr'." 
    fi
}

Затем:

$ myfunc 'o "M' 'echo "My String"'
String 'echo "My String"' contain substring 'o "M'.

$ myfunc 'alt' 'echo "My String"'
String 'echo "My String"' don't contain substring 'alt'.

Обратите внимание: вы должны избегать или заключать двойные кавычки и / или двойные кавычки:

$ myfunc 'o "M' echo "My String"
String 'echo My String' don't contain substring: 'o "M'.

$ myfunc 'o "M' echo \"My String\"
String 'echo "My String"' contain substring: 'o "M'.

Простая функция

Это было проверено в busybox, dash и, конечно, bash:

stringContain() { [ -z "${2##*$1*}" ]; }

Это все, ребята!

То теперь:

$ if stringContain 'o "M3' 'echo "My String"';then echo yes;else echo no;fi
no
$ if stringContain 'o "M' 'echo "My String"';then echo yes;else echo no;fi
yes

... Или если отправленная строка может быть пустой, как указано @Sjlver, функция станет такой:

stringContain() { [ -z "${2##*$1*}" ] && [ -z "$1" -o -n "$2" ]; }

или в соответствии с предложением Адриана Гюнтера, избегая -o переключатели на:

stringContain() { [ -z "${2##*$1*}" ] && { [ -z "$1" ] || [ -n "$2" ] ;} ; }

С пустыми строками:

$ if stringContain '' ''; then echo yes; else echo no; fi
yes
$ if stringContain 'o "M' ''; then echo yes; else echo no; fi
no

Вы должны помнить, что сценарии оболочки - это не столько язык, сколько набор команд. Инстинктивно вы думаете, что этот "язык" требует от вас следовать if с [ или [[, Обе эти команды - просто команды, которые возвращают состояние выхода, указывающее на успех или неудачу (как и любая другая команда). По этой причине я бы использовал grepи не [ команда.

Просто делать:

if grep -q foo <<<"$string"; then
    echo "It's there"
fi

Теперь, когда вы думаете о if как проверка состояния выхода команды, которая следует за ней (завершается точкой с запятой). Почему бы не пересмотреть источник строки, которую вы тестируете?

## Instead of this
filetype="$(file -b "$1")"
if grep -q "tar archive" <<<"$filetype"; then
#...

## Simply do this
if file -b "$1" | grep -q "tar archive"; then
#...

-q опция заставляет grep ничего не выводить, так как нам нужен только код возврата. <<< заставляет оболочку развернуть следующее слово и использовать его в качестве входных данных для команды, однострочной версии << здесь документ (я не уверен, является ли это стандартным или bashism).

Принятый ответ лучше, но поскольку есть несколько способов сделать это, вот другое решение:

if [ "$string" != "${string/foo/}" ]; then
    echo "It's there!"
fi

${var/search/replace} является $var с первым экземпляром search заменен на replace, если он найден (не меняется $var). Если вы попытаетесь заменить foo ничем, и строка изменилась, то, очевидно, foo был найден.

Таким образом, есть много полезных решений вопроса - но какой из них быстрее / использует меньше всего ресурсов?

Повторные тесты с использованием этого кадра:

/usr/bin/time bash -c 'a=two;b=onetwothree; x=100000; while [ $x -gt 0 ]; do TEST ; x=$(($x-1)); done'

Замена TEST каждый раз:

[[ $b =~ $a ]]           2.92user 0.06system 0:02.99elapsed 99%CPU

[ "${b/$a//}" = "$b" ]   3.16user 0.07system 0:03.25elapsed 99%CPU

[[ $b == *$a* ]]         1.85user 0.04system 0:01.90elapsed 99%CPU

case $b in *$a):;;esac   1.80user 0.02system 0:01.83elapsed 99%CPU

doContain $a $b          4.27user 0.11system 0:04.41elapsed 99%CPU

(doContain был в ответе Ф. Хури)

И для хихиканья:

echo $b|grep -q $a       12.68user 30.86system 3:42.40elapsed 19%CPU !ouch!

Таким образом, опция простого замещения предсказуемо выигрывает, будь то в расширенном тесте или в случае. Чехол портативный.

Выпадение до 100000 greps предсказуемо больно! Старое правило об использовании внешних утилит без необходимости сохраняется.

Bash4+ примеры. Примечание: не использование кавычек вызовет проблемы, когда слова содержат пробелы и т. Д. Всегда заключайте в кавычки bash IMO.

Вот несколько примеров BASH4+:

Пример 1, проверьте "да" в строке (без учета регистра):

    if [[ "${str,,}" == *"yes"* ]] ;then

Пример 2, проверьте "да" в строке (без учета регистра):

    if [[ "$(echo "$str" | tr '[:upper:]' '[:lower:]')" == *"yes"* ]] ;then

Пример 3, проверьте "да" в строке (с учетом регистра):

     if [[ "${str}" == *"yes"* ]] ;then

Пример 4, проверьте "да" в строке (с учетом регистра):

     if [[ "${str}" =~ "yes" ]] ;then

Пример 5, точное совпадение (с учетом регистра):

     if [[ "${str}" == "yes" ]] ;then

Пример 6, точное совпадение (без учета регистра):

     if [[ "${str,,}" == "yes" ]] ;then

Пример 7, точное совпадение:

     if [ "$a" = "$b" ] ;then

наслаждаться.

Это также работает:

if printf -- '%s' "$haystack" | egrep -q -- "$needle"
then
  printf "Found needle in haystack"
fi

И отрицательный тест:

if ! printf -- '%s' "$haystack" | egrep -q -- "$needle"
then
  echo "Did not find needle in haystack"
fi

Я полагаю, что этот стиль немного более классический - менее зависимый от особенностей оболочки Bash.

-- Аргумент - это паранойя POSIX, используемая для защиты от строк ввода, аналогичных опциям, таким как --abc или же -a,

Примечание: в тесном цикле этот код будет намного медленнее, чем при использовании внутренних функций оболочки Bash, так как один (или два) отдельных процесса будут создаваться и соединяться через каналы.

Как Павел упоминал в своем сравнении производительности:

if echo "abcdefg" | grep -q "bcdef"; then
    echo "String contains is true."
else
    echo "String contains is not true."
fi

Это соответствует POSIX, как ответ 'case' $ string 'in', предоставленный Маркусом, но его легче читать, чем ответ оператора case. Также обратите внимание, что это будет намного медленнее, чем использование оператора case, как указал Пол, не используйте его в цикле.

Как насчет этого:

text="   <tag>bmnmn</tag>  "
if [[ "$text" =~ "<tag>" ]]; then
   echo "matched"
else
   echo "not matched"
fi

Принятый ответ правильный, но его трудно прочитать и понять.
Для проблем, связанных с поиском, вы всегда должны использовать $needle в идиоме $haystack.
Поскольку предлагаемая очередь редактирования заполнена , я публикую это:

      haystack='There are needles here.'
if [[ "$haystack" == *"needle"* ]]; then
    echo "It's there!"
fi

Этот ответ переполнения стека был единственным, кто захватил пробелы и символы тире:

# For null cmd arguments checking   
to_check=' -t'
space_n_dash_chars=' -'
[[ $to_check == *"$space_n_dash_chars"* ]] && echo found
[[ $string == *foo* ]] && echo "It's there" || echo "Couldn't find"

Один:

[ $(expr $mystring : ".*${search}.*") -ne 0 ] && echo 'yes' ||  echo 'no'

Поскольку вопрос POSIX/BusyBox закрыт без предоставления правильного ответа (IMHO), я отправлю ответ здесь.

Самый короткий ответ:

[ ${_string_##*$_substring_*} ] || echo Substring found!

или

[ "${_string_##*$_substring_*}" ] || echo 'Substring found!'

Обратите внимание, что двойной хеш является обязательным для некоторых оболочек (ash). Выше буду оценивать[ stringvalue ]когда подстрока не найдена. Ошибка не возвращается. Когда подстрока найдена, результат пуст и вычисляется[ ]. Это вызовет код ошибки 1, поскольку строка полностью заменена (из-за*).

Самый короткий и распространенный синтаксис:

[ -z "${_string_##*$_substring_*}" ] && echo 'Substring found!'

или

[ -n "${_string_##*$_substring_*}" ] || echo 'Substring found!'

Другой:

[ "${_string_##$_substring_}" != "$_string_" ] && echo 'Substring found!'

или

[ "${_string_##$_substring_}" = "$_string_" ] || echo 'Substring found!'

Обратите внимание на единственный знак равенства!

Мне нравится Сед.

substr="foo"
nonsub="$(echo "$string" | sed "s/$substr//")"
hassub=0 ; [ "$string" != "$nonsub" ] && hassub=1

Изменить, Логика:

  • Используйте sed, чтобы удалить экземпляр подстроки из строки

  • Если новая строка отличается от старой, существует подстрока

Мой.bash_profile и как я использовал grep, если в PATH включены мои 2 папки bin, не добавляйте их

# .bash_profile
# Get the aliases and functions
if [ -f ~/.bashrc ]; then
    . ~/.bashrc
fi

U=~/.local.bin:~/bin

if ! echo "$PATH" | grep -q "home"; then
    export PATH=$PATH:${U}   
fi

Общий пример стога сена с иголками следующий с переменными

#!/bin/bash

needle="a_needle"
haystack="a_needle another_needle a_third_needle"
if [[ $haystack == *"$needle"* ]]; then
    echo "needle found"
else
    echo "needle NOT found"
fi

На расширение вопроса ответили здесь /questions/38249813/kak-vyi-skazhete-soderzhit-li-stroka-druguyu-stroku-v-posix-sh/38249870#38249870

Это решение работает со специальными символами:

# contains(string, substring)
#
# Returns 0 if the specified string contains the specified substring,
# otherwise returns 1.
contains() {
    string="$1"
    substring="$2"

    if echo "$string" | $(type -p ggrep grep | head -1) -F -- "$substring" >/dev/null; then
        return 0    # $substring is in $string
    else
        return 1    # $substring is not in $string
    fi
}

contains "abcd" "e" || echo "abcd does not contain e"
contains "abcd" "ab" && echo "abcd contains ab"
contains "abcd" "bc" && echo "abcd contains bc"
contains "abcd" "cd" && echo "abcd contains cd"
contains "abcd" "abcd" && echo "abcd contains abcd"
contains "" "" && echo "empty string contains empty string"
contains "a" "" && echo "a contains empty string"
contains "" "a" || echo "empty string does not contain a"
contains "abcd efgh" "cd ef" && echo "abcd efgh contains cd ef"
contains "abcd efgh" " " && echo "abcd efgh contains a space"

contains "abcd [efg] hij" "[efg]" && echo "abcd [efg] hij contains [efg]"
contains "abcd [efg] hij" "[effg]" || echo "abcd [efg] hij does not contain [effg]"

contains "abcd *efg* hij" "*efg*" && echo "abcd *efg* hij contains *efg*"
contains "abcd *efg* hij" "d *efg* h" && echo "abcd *efg* hij contains d *efg* h"
contains "abcd *efg* hij" "*effg*" || echo "abcd *efg* hij does not contain *effg*"

grep -q полезно для этого.

То же самое, используя awk:

string="unix-bash 2389"
character="@"
printf '%s' "$string" | awk -vc="$character" '{ if (gsub(c, "")) { print "Found" } else { print "Not Found" } }'

Выход:

не обнаружена

string="unix-bash 2389"
character="-"
printf '%s' "$string" | awk -vc="$character" '{ if (gsub(c, "")) { print "Found" } else { print "Not Found" } }'

Выход:

Найденный

Первоисточник: http://unstableme.blogspot.com/2008/06/bash-search-letter-in-string-awk.html

case $string in (*foo*)
  # Do stuff
esac

Это тот же ответ, что и /questions/33095505/kak-proverit-soderzhit-li-stroka-podstroku-v-bash/33095537#33095537. Но простой стиль, а также POSIX-совместимый.

Я обнаружил, что эта функция нужна довольно часто, поэтому я использую самодельную функцию оболочки в моем .bashrc вот так, что позволяет мне использовать его так часто, как мне нужно, с легко запоминающимся именем:

function stringinstring()
{
    case "$2" in 
       *"$1"*)
          return 0
       ;;
    esac   
    return 1
}

Чтобы проверить, если $string1 (скажем, abc) содержится в $string2 (скажем, 123abcABC) Мне просто нужно запустить stringinstring "$string1" "$string2" и проверьте возвращаемое значение, например

stringinstring "$str1" "$str2"  &&  echo YES  ||  echo NO

Точное совпадение слов:

string='My long string'
exactSearch='long'

if grep -E -q "\b${exactSearch}\b" <<<${string} >/dev/null 2>&1
  then
    echo "It's there"
  fi

Попробуйте oobash, это библиотека строк OO-стиля для bash 4. Она поддерживает немецкие умлауты. Это написано на bash. Доступны многие функции: -base64Decode, -base64Encode, -capitalize, -center, -charAt, -concat, -contains, -count, -endsWith, -equals, -equalsIgnoreCase, -reverse, -hashCode, -indexOf, -isAlnum, -isAlpha, -isAscii, -isDigit, -isEmpty, -isHexDigit, -isLowerCase, -isSpace, -isPrintable, -isUpperCase, -isVisible, -lastIndexOf, -length, -matches, -replaceAll, -replaceFirst, -startsWith, -substring, -swapCase, -toLowerCase, -toString, -toUpperCase, -trim, а также -zfill,

Посмотрите на содержащийся пример:

[Desktop]$ String a testXccc                                                  
[Desktop]$ a.contains tX                   
true                                                           
[Desktop]$ a.contains XtX      
false      

oobash доступен на Sourceforge.net.

Вы можете использовать логику && , чтобы быть более компактным

      #!/bin/bash

# NO MATCH EXAMPLE
string="test"
[[ "$string" == *"foo"* ]] && {
        echo "YES"
}

# MATCH EXAMPLE
string="tefoost"
[[ "$string" == *"foo"* ]] && {
        echo "YES"
}

Я использую эту функцию (одна зависимость не включена, но очевидна). Он проходит испытания, показанные ниже. Если функция возвращает значение> 0, то строка была найдена. Вы могли бы так же легко вернуть 1 или 0 вместо этого.

function str_instr {
   # Return position of ```str``` within ```string```.
   # >>> str_instr "str" "string"
   # str: String to search for.
   # string: String to search.
   typeset str string x
   # Behavior here is not the same in bash vs ksh unless we escape special characters.
   str="$(str_escape_special_characters "${1}")"
   string="${2}"
   x="${string%%$str*}"
   if [[ "${x}" != "${string}" ]]; then
      echo "${#x} + 1" | bc -l
   else
      echo 0
   fi
}

function test_str_instr {
   str_instr "(" "'foo@host (dev,web)'" | assert_eq 11
   str_instr ")" "'foo@host (dev,web)'" | assert_eq 19
   str_instr "[" "'foo@host [dev,web]'" | assert_eq 11
   str_instr "]" "'foo@host [dev,web]'" | assert_eq 19
   str_instr "a" "abc" | assert_eq 1
   str_instr "z" "abc" | assert_eq 0
   str_instr "Eggs" "Green Eggs And Ham" | assert_eq 7
   str_instr "a" "" | assert_eq 0
   str_instr "" "" | assert_eq 0
   str_instr " " "Green Eggs" | assert_eq 6
   str_instr " " " Green "  | assert_eq 1
}

Вот вариант POSIX, но с:

      string="My string"
pattern="string"

if [ "${string}" != "$(printf '%s' "${string}" | sed 's/'"${pattern}"'//g')" ]; then
 echo "It's there!"; 
fi

Некоторые объяснения:

sed 's/'"${pattern}"'//g'срывает узор${string}. Итак, это будет выглядеть так:

      if [ "My string" != "My " ];

Они не равны и этоtrue, это означает, что шаблон был там.

Если вы используете другой шаблон, напримерpattern="foo", уравнение будет:

      if [ "My string" != "My string" ];

Потому чтоsedв этом случае ничего не будет разбирать и будет производитьfalse.

Это по-прежнему выглядит неуклюже, но эта опция будет работать во многих оболочках, таких как Dash, ZSH и не только в Bash.

msg="message"

function check {
    echo $msg | egrep [abc] 1> /dev/null

    if [ $? -ne 1 ];
    then 
        echo "found" 
    else 
        echo "not found" 
    fi
}

check

Это обнаружит любое появление a, b или c

С jq:

      string='My long string'
echo $string | jq -Rr 'select(contains("long"))|"It is there"'

Самое сложное в jq — вывести одинарную кавычку:

      echo $string | jq --arg quote "'" -Rr 'select(contains("long"))|"It\($quote)s there"'

Использование jq только для проверки условия:

      if jq -Re 'select(contains("long"))|halt' <<< $string; then
    echo "It's there!"
fi
Другие вопросы по тегам