Длина строки в баш
Как получить длину строки, хранящейся в переменной, и присвоить ее другой переменной?
myvar="some string"
echo ${#myvar}
# 11
Как установить другую переменную для вывода 11
?
13 ответов
Длина строки UTF-8
В дополнение к правильному ответу fedorqui я хотел бы показать разницу между длиной строки и длиной в байтах:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen
окажет:
Généralités is 11 char len, but 14 bytes len.
Вы могли бы даже взглянуть на сохраненные символы:
myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"
будет отвечать:
Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').
Примечание: согласно комментарию Изабелл Коуэн, я добавил $LC_ALL
вместе с $LANG
,
Длина аргумента
Аргумент работает так же, как обычные переменные
strLen() {
local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
printf -v sreal %q "$1"
LANG=$oLang LC_ALL=$oLcAll
printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}
будет работать как
strLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'
полезным printf
инструмент коррекции:
Если ты:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
printf " - %-14s is %2d char length\n" "'$string'" ${#string}
done
- 'Généralités' is 11 char length
- 'Language' is 8 char length
- 'Théorème' is 8 char length
- 'Février' is 7 char length
- 'Left: ←' is 7 char length
- 'Yin Yang ☯' is 10 char length
Не очень красиво... Для этого есть небольшая функция:
strU8DiffLen () {
local bytlen oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#1}
LANG=$oLang LC_ALL=$oLcAll
return $(( bytlen - ${#1} ))
}
То теперь:
for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do
strU8DiffLen "$string"
printf " - %-$((14+$?))s is %2d chars length, but use %2d bytes\n" \
"'$string'" ${#string} $((${#string}+$?))
done
- 'Généralités' is 11 chars length, but use 14 bytes
- 'Language' is 8 chars length, but use 8 bytes
- 'Théorème' is 8 chars length, but use 10 bytes
- 'Février' is 7 chars length, but use 8 bytes
- 'Left: ←' is 7 chars length, but use 9 bytes
- 'Yin Yang ☯' is 10 chars length, but use 12 bytes
Чтобы получить длину строки, хранящейся в переменной, скажите:
myvar="some string"
size=${#myvar}
Чтобы подтвердить, что он был правильно сохранен, echo
Это:
$ echo "$size"
11
Я хотел простейший случай, наконец, это результат:
echo -n 'Tell me the length of this sentence.' | wc -m;
36
Ты можешь использовать:
MYSTRING="abc123"
MYLENGTH=$(printf "%s" "$MYSTRING" | wc -c)
wc -c
или жеwc --bytes
для количества байтов = символы Юникода считаются с 2, 3 или более байтами.wc -m
или жеwc --chars
для количества символов = символы Юникода считаются одиночными, пока они не используют больше байтов.
В ответ на пост запуска:
Если вы хотите использовать это с аргументами командной строки или функции...
с кодом:
size=${#1}
Может случиться так, что вы просто хотите проверить аргумент нулевой длины и вам не нужно хранить переменную. Я считаю, что вы можете использовать такой синтаксис:
if [ -z "$1" ]; then
#zero length argument
else
#non-zero length
fi
Смотрите GNU и wooledge для более полного списка условных выражений Bash.
Если вы хотите использовать это с аргументами командной строки или функции, убедитесь, что вы используете size=${#1}
вместо size=${#$1}
, Второй может быть более инстинктивным, но имеет неверный синтаксис.
Используя ваш пример при условии
#KISS (Keep it simple stupid)
size=${#myvar}
echo $size
Вот несколько способов вычислить длину переменной:
echo ${#VAR}
echo -n $VAR | wc -m
echo -n $VAR | wc -c
printf $VAR | wc -m
expr length $VAR
expr $VAR : '.*'
и чтобы установить результат в другой переменной, просто назначьте указанную выше команду с кавычкой в другую переменную следующим образом:
otherVar=`echo -n $VAR | wc -m`
echo $otherVar
http://techopsbook.blogspot.in/2017/09/how-to-find-length-of-string-variable.html
Я пытался сделать что-то подобное, но я просто хотел убедиться, что пользовательский ввод не был слишком длинным.
if [ ${#string} -ge 12 ]; then
echo ">= 12 characters. too long"
exit
else
echo "under 12 characters, not too long."
fi
Я знаю, что вопросы и ответы достаточно стары, но сегодня я впервые столкнулся с этой задачей. Обычно я использовал
${#var}
комбинация, но она не работает с юникодом: большая часть текста, который я обрабатываю с помощью bash, написана на кириллице ... Основываясь на ответе @atesin, я сделал короткую (и готовую к сокращению) функцию, которую можно использовать для написания сценариев. Это была задача, которая привела меня к этому вопросу: показать какое-то сообщение переменной длины в псевдографическом поле. Итак, вот оно:
$ cat draw_border.sh
#!/bin/sh
#based on https://stackoverflow.com/questions/17368067/length-of-string-in-bash
border()
{
local BPAR="$1"
local BPLEN=`echo $BPAR|wc -m`
local OUTLINE=\|\ "$1"\ \|
# line below based on https://www.cyberciti.biz/faq/repeat-a-character-in-bash-script-under-linux-unix/
# comment of Bit Twiddler Jun 5, 2021 @ 8:47
local OUTBORDER=\+`head -c $(($BPLEN+1))</dev/zero|tr '\0' '-'`\+
echo $OUTBORDER
echo $OUTLINE
echo $OUTBORDER
}
border "Généralités"
border 'А вот еще одна '$LESSCLOSE' '
border "pure ENGLISH"
И что дает этот образец:
$ draw_border.sh
+-------------+
| Généralités |
+-------------+
+----------------------------------+
| А вот еще одна /usr/bin/lesspipe |
+----------------------------------+
+--------------+
| pure ENGLISH |
+--------------+
Первый пример (на французском?) Был взят из приведенного выше примера. Второй объединяет кириллицу и значение некоторой переменной. Третий вариант говорит сам за себя: всего 1 с 1/2 символов ASCII.
я использовал
echo $BPAR|wc -m
вместо того
printf ...
чтобы не полагаться на встроенный printf или нет.
Выше я видел разговоры о завершающем символе новой строки и параметре для
echo
. Я не использовал его, поэтому добавляю только один в список
$BPLEN
. Должен ли я использовать
-n
, Я должен добавить 2.
Чтобы объяснить разницу между
wc -m
а также
wc -c
см. тот же сценарий с одним незначительным изменением:
-m
был заменен на
-c
$ draw_border.sh
+----------------+
| Généralités |
+----------------+
+---------------------------------------------+
| А вот еще одна /usr/bin/lesspipe |
+---------------------------------------------+
+--------------+
| pure ENGLISH |
+--------------+
Знаки с диакритическими знаками в латинице и большинство знаков в кириллице двухбайтовые, поэтому длина нарисованных горизонталей больше реальной длины сообщения. Надеюсь, это кому-нибудь сэкономит время :-)
ps русский текст говорит "вот еще один"
pps Рабочий "двухстрочный"
#!/bin/sh
#based on https://stackoverflow.com/questions/17368067/length-of-string-in-bash
border()
{
# line below based on https://www.cyberciti.biz/faq/repeat-a-character-in-bash-script-under-linux-unix/
# comment of Bit Twiddler Jun 5, 2021 @ 8:47
local OUTBORDER=\+`head -c $(( $(echo "$1"|wc -m) +1))</dev/zero|tr '\0' '-'`\+
echo $OUTBORDER"\n"\|\ "$1"\ \|"\n"$OUTBORDER
}
border "Généralités"
border 'А вот еще одна '$LESSCLOSE' '
border "pure ENGLISH"
Чтобы не загромождать код повторяющейся прорисовкой OUTBORDER, я вынесла формирование OUTBORDER в отдельную команду
Длина строки в bash
str="Welcome to Stackoveflow"
length=`expr length "$str"`
echo "Length of '$str' is $length"
ВЫХОД
Длина «Добро пожаловать в Stackoveflow» составляет 23 байта.
Я бы использовал что-то вроде этого:
var2=$(echo $myvar | wc -c)
Вам не нужен сценарий.