Длина строки в баш

Как получить длину строки, хранящейся в переменной, и присвоить ее другой переменной?

myvar="some string"
echo ${#myvar}  
# 11

Как установить другую переменную для вывода 11?

13 ответов

Решение

Длина строки UTF-8

В дополнение к правильному ответу fedorqui я хотел бы показать разницу между длиной строки и длиной в байтах:

myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen

окажет:

Généralités is 11 char len, but 14 bytes len.

Вы могли бы даже взглянуть на сохраненные символы:

myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"

будет отвечать:

Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').

Примечание: согласно комментарию Изабелл Коуэн, я добавил $LC_ALL вместе с $LANG,

Длина аргумента

Аргумент работает так же, как обычные переменные

strLen() {
    local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
    LANG=C LC_ALL=C
    bytlen=${#1}
    printf -v sreal %q "$1"
    LANG=$oLang LC_ALL=$oLcAll
    printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}

будет работать как

strLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'

полезным printf инструмент коррекции:

Если ты:

for string in Généralités Language Théorème Février  "Left: ←" "Yin Yang ☯";do
    printf " - %-14s is %2d char length\n" "'$string'"  ${#string}
done

 - 'Généralités' is 11 char length
 - 'Language'     is  8 char length
 - 'Théorème'   is  8 char length
 - 'Février'     is  7 char length
 - 'Left: ←'    is  7 char length
 - 'Yin Yang ☯' is 10 char length

Не очень красиво... Для этого есть небольшая функция:

strU8DiffLen () { 
    local bytlen oLang=$LANG oLcAll=$LC_ALL
    LANG=C LC_ALL=C
    bytlen=${#1}
    LANG=$oLang LC_ALL=$oLcAll
    return $(( bytlen - ${#1} ))
}

То теперь:

for string in Généralités Language Théorème Février  "Left: ←" "Yin Yang ☯";do
    strU8DiffLen "$string"
    printf " - %-$((14+$?))s is %2d chars length, but use %2d bytes\n" \
        "'$string'" ${#string} $((${#string}+$?))
  done 

 - 'Généralités'  is 11 chars length, but use 14 bytes
 - 'Language'     is  8 chars length, but use  8 bytes
 - 'Théorème'     is  8 chars length, but use 10 bytes
 - 'Février'      is  7 chars length, but use  8 bytes
 - 'Left: ←'      is  7 chars length, but use  9 bytes
 - 'Yin Yang ☯'   is 10 chars length, but use 12 bytes

Чтобы получить длину строки, хранящейся в переменной, скажите:

myvar="some string"
size=${#myvar} 

Чтобы подтвердить, что он был правильно сохранен, echo Это:

$ echo "$size"
11

Я хотел простейший случай, наконец, это результат:

echo -n 'Tell me the length of this sentence.' | wc -m;
36

Ты можешь использовать:

MYSTRING="abc123"
MYLENGTH=$(printf "%s" "$MYSTRING" | wc -c)
  • wc -c или же wc --bytes для количества байтов = символы Юникода считаются с 2, 3 или более байтами.
  • wc -m или же wc --chars для количества символов = символы Юникода считаются одиночными, пока они не используют больше байтов.

В ответ на пост запуска:

Если вы хотите использовать это с аргументами командной строки или функции...

с кодом:

size=${#1}

Может случиться так, что вы просто хотите проверить аргумент нулевой длины и вам не нужно хранить переменную. Я считаю, что вы можете использовать такой синтаксис:

if [ -z "$1" ]; then
    #zero length argument 
else
    #non-zero length
fi

Смотрите GNU и wooledge для более полного списка условных выражений Bash.

Если вы хотите использовать это с аргументами командной строки или функции, убедитесь, что вы используете size=${#1} вместо size=${#$1}, Второй может быть более инстинктивным, но имеет неверный синтаксис.

Используя ваш пример при условии

#KISS (Keep it simple stupid)
size=${#myvar}
echo $size

Вот несколько способов вычислить длину переменной:

echo ${#VAR}
echo -n $VAR | wc -m
echo -n $VAR | wc -c
printf $VAR | wc -m
expr length $VAR
expr $VAR : '.*'

и чтобы установить результат в другой переменной, просто назначьте указанную выше команду с кавычкой в ​​другую переменную следующим образом:

otherVar=`echo -n $VAR | wc -m`   
echo $otherVar

http://techopsbook.blogspot.in/2017/09/how-to-find-length-of-string-variable.html

Я пытался сделать что-то подобное, но я просто хотел убедиться, что пользовательский ввод не был слишком длинным.

if [ ${#string} -ge 12 ]; then 
    echo ">= 12 characters. too long"
    exit
else 
    echo "under 12 characters, not too long."
fi

Может быть, просто используйте:

      echo $myvar | wc -c

Я знаю, что вопросы и ответы достаточно стары, но сегодня я впервые столкнулся с этой задачей. Обычно я использовал ${#var}комбинация, но она не работает с юникодом: большая часть текста, который я обрабатываю с помощью bash, написана на кириллице ... Основываясь на ответе @atesin, я сделал короткую (и готовую к сокращению) функцию, которую можно использовать для написания сценариев. Это была задача, которая привела меня к этому вопросу: показать какое-то сообщение переменной длины в псевдографическом поле. Итак, вот оно:

      $ cat draw_border.sh
#!/bin/sh
#based on https://stackoverflow.com/questions/17368067/length-of-string-in-bash
border()
{
local BPAR="$1"
local BPLEN=`echo $BPAR|wc -m`
local OUTLINE=\|\ "$1"\ \|
# line below based on https://www.cyberciti.biz/faq/repeat-a-character-in-bash-script-under-linux-unix/
# comment of Bit Twiddler Jun 5, 2021 @ 8:47
local OUTBORDER=\+`head -c $(($BPLEN+1))</dev/zero|tr '\0' '-'`\+
echo $OUTBORDER
echo $OUTLINE
echo $OUTBORDER
}
border "Généralités"
border 'А вот еще одна '$LESSCLOSE' '
border "pure ENGLISH"

И что дает этот образец:

      $ draw_border.sh
+-------------+
| Généralités |
+-------------+
+----------------------------------+
| А вот еще одна /usr/bin/lesspipe |
+----------------------------------+
+--------------+
| pure ENGLISH |
+--------------+

Первый пример (на французском?) Был взят из приведенного выше примера. Второй объединяет кириллицу и значение некоторой переменной. Третий вариант говорит сам за себя: всего 1 с 1/2 символов ASCII.

я использовал echo $BPAR|wc -m вместо того printf ... чтобы не полагаться на встроенный printf или нет.

Выше я видел разговоры о завершающем символе новой строки и параметре для echo. Я не использовал его, поэтому добавляю только один в список $BPLEN. Должен ли я использовать -n, Я должен добавить 2.

Чтобы объяснить разницу между wc -m а также wc -cсм. тот же сценарий с одним незначительным изменением: -m был заменен на -c

      $ draw_border.sh
+----------------+
| Généralités |
+----------------+
+---------------------------------------------+
| А вот еще одна /usr/bin/lesspipe |
+---------------------------------------------+
+--------------+
| pure ENGLISH |
+--------------+

Знаки с диакритическими знаками в латинице и большинство знаков в кириллице двухбайтовые, поэтому длина нарисованных горизонталей больше реальной длины сообщения. Надеюсь, это кому-нибудь сэкономит время :-)

ps русский текст говорит "вот еще один"

pps Рабочий "двухстрочный"

      #!/bin/sh
#based on https://stackoverflow.com/questions/17368067/length-of-string-in-bash
border()
{
# line below based on https://www.cyberciti.biz/faq/repeat-a-character-in-bash-script-under-linux-unix/
# comment of Bit Twiddler Jun 5, 2021 @ 8:47
local OUTBORDER=\+`head -c $(( $(echo "$1"|wc -m) +1))</dev/zero|tr '\0' '-'`\+
echo $OUTBORDER"\n"\|\ "$1"\ \|"\n"$OUTBORDER
}
border "Généralités"
border 'А вот еще одна '$LESSCLOSE' '
border "pure ENGLISH"

Чтобы не загромождать код повторяющейся прорисовкой OUTBORDER, я вынесла формирование OUTBORDER в отдельную команду

Длина строки в bash

      str="Welcome to Stackoveflow"  
length=`expr length "$str"`  
  
echo "Length of '$str' is $length"

ВЫХОД

Длина «Добро пожаловать в Stackoveflow» составляет 23 байта.

Я бы использовал что-то вроде этого:

var2=$(echo $myvar | wc -c)

Вам не нужен сценарий.

Другие вопросы по тегам