Как посчитать вхождение строки в строку?

Question

Как посчитать вхождение строки в строку?

Как я могу посчитать, сколько раз конкретная строка встречается в другой строке. Например, это то, что я пытаюсь сделать в Javascript:

var temp = "This is a string.";
alert(temp.count("is")); //should output '2'

846

javascript regex string

Источник

user235334 24 окт '10 в 18:39

45 ответов

Решение

/** Function that count occurrences of a substring in a string;
 * @param {String} string               The string
 * @param {String} subString            The sub string to search for
 * @param {Boolean} [allowOverlapping]  Optional. (Default:false)
 *
 * @author Vitim.us https://gist.github.com/victornpb/7736865
 * @see Unit Test https://jsfiddle.net/Victornpb/5axuh96u/
 * @see http://stackru.com/questions/4009756/how-to-count-string-occurrence-in-string/7924240#7924240
 */
function occurrences(string, subString, allowOverlapping) {

    string += "";
    subString += "";
    if (subString.length <= 0) return (string.length + 1);

    var n = 0,
        pos = 0,
        step = allowOverlapping ? 1 : subString.length;

    while (true) {
        pos = string.indexOf(subString, pos);
        if (pos >= 0) {
            ++n;
            pos += step;
        } else break;
    }
    return n;
}

использование

occurrences("foofoofoo", "bar"); //0

occurrences("foofoofoo", "foo"); //3

occurrences("foofoofoo", "foofoo"); //1

allowOverlapping

occurrences("foofoofoo", "foofoo", true); //2

Матчи:

  foofoofoo
1 `----´
2    `----´

Модульный тест

https://jsfiddle.net/Victornpb/5axuh96u/

эталонный тест

Я провел тестирование производительности, и моя функция более чем в 10 раз быстрее, чем функция соответствия регулярному выражению, опубликованная gumbo. В моем тесте длина строки составляет 25 символов. с 2 вхождениями персонажа "о". Я выполнил 1 000 000 раз в Safari.
Safari 5.1
Тест> Общее время выполнения: 5617 мс (регулярное выражение)
Тест> Общее время выполнения: 881 мс (моя функция в 6,4 раза быстрее)
Firefox 4
Тест> Общее время выполнения: 8547 мс (Rexexp)
Тест> Общее время выполнения: 634 мс (моя функция в 13,5 раз быстрее)
Изменить: изменения, которые я сделал
длина кешированной подстроки
добавлено приведение типов к строке.
добавлен необязательный параметр allowOverlapping
исправлен правильный вывод для "" пустого подстроки.

Суть

https://gist.github.com/victornpb/7736865

279

Источник

user938822 28 окт '11 в 01:27

function countInstances(string, word) {
   return string.split(word).length - 1;
}

218

Источник

user369591 24 окт '10 в 18:43

Вы можете попробовать это:

var theString = "This is a string.";
console.log(theString.split("is").length - 1);

115

Источник

user2101744 24 фев '13 в 17:30

Мое решение:

var temp = "This is a string.";

function countOcurrences(str, value) {
  var regExp = new RegExp(value, "gi");
  return (str.match(regExp) || []).length;
}

console.log(countOcurrences(temp, 'is'));

43

Источник

user1861292 09 апр '13 в 01:20

Ты можешь использовать match определить такую функцию:

String.prototype.count = function(search) {
    var m = this.match(new RegExp(search.toString().replace(/(?=[.\\+*?[^\]$(){}\|])/g, "\\"), "g"));
    return m ? m.length:0;
}

21

Источник

user53114 24 окт '10 в 18:45

Просто используйте код для решения Rebecca Chernoff:-)

alert(("This is a string.".match(/is/g) || []).length);

14

Источник

user684229 13 авг '11 в 18:16

Версия без регулярных выражений:

 var string = 'This is a string',
    searchFor = 'is',
    count = 0,
    pos = string.indexOf(searchFor);

while (pos > -1) {
    ++count;
    pos = string.indexOf(searchFor, ++pos);
}

console.log(count);   // 2

14

Источник

user530659 15 мар '14 в 08:21

String.prototype.Count = function (find) { return this.split(find).length - 1; } "This is a string.".Count("is");

Это вернет 2.

12

Источник

user6815733 10 сен '16 в 03:53

Вот самая быстрая функция!

Почему это быстрее?

Не проверяет char по char (за 1 исключением)
Использует время и увеличивает на 1 переменную (число символов переменной) по сравнению с циклом for, проверяющим длину и увеличивающим 2 переменной (обычно это переменная i и переменная с количеством символов)
Использует путь меньше в
Не использует регулярные выражения!
Использует (надеюсь) высоко оптимизированную функцию
Все операции объединены настолько, насколько это возможно, что позволяет избежать замедления из-за нескольких операций.
```
String.prototype.timesCharExist=function(c){var t=0,l=0,c=(c+'')[0];while(l=this.indexOf(c,l)+1)++t;return t};
```

Вот более медленная и более читаемая версия:

    String.prototype.timesCharExist = function ( chr ) {
        var total = 0, last_location = 0, single_char = ( chr + '' )[0];
        while( last_location = this.indexOf( single_char, last_location ) + 1 )
        {
            total = total + 1;
        }
        return total;
    };

Этот медленнее из-за счетчика, длинных имен var и неправильного использования 1 var.

Чтобы использовать это, вы просто делаете это:

    'The char "a" only shows up twice'.timesCharExist('a');

Изменить: (2013/12/16)

НЕ используйте с Opera 12.16 или старше! это займет почти в 2,5 раза больше, чем решение регулярных выражений!

В Chrome это решение займет от 14 до 20 мс для 1000000 символов.

Решение регулярных выражений занимает 11-14ms для того же количества.

Используя функцию (снаружи String.prototype) займет около 10-13мс.

Вот код, используемый:

    String.prototype.timesCharExist=function(c){var t=0,l=0,c=(c+'')[0];while(l=this.indexOf(c,l)+1)++t;return t};

    var x=Array(100001).join('1234567890');

    console.time('proto');x.timesCharExist('1');console.timeEnd('proto');

    console.time('regex');x.match(/1/g).length;console.timeEnd('regex');

    var timesCharExist=function(x,c){var t=0,l=0,c=(c+'')[0];while(l=x.indexOf(c,l)+1)++t;return t;};

    console.time('func');timesCharExist(x,'1');console.timeEnd('func');

Результат всех решений должен быть 100 000!

Примечание: если вы хотите, чтобы эта функция считала более 1 символа, измените где c=(c+'')[0] в c=c+''

8

Источник

user2729937 29 авг '13 в 15:40

var temp = "This is a string.";
console.log((temp.match(new RegExp("is", "g")) || []).length);

7

Источник

user2172547 18 ноя '15 в 12:56

Простым способом было бы разделить строку на требуемое слово, слово, для которого мы хотим вычислить количество вхождений, и вычесть 1 из количества частей:

      function checkOccurences(string, word) {
      return string.split(word).length - 1;
}
const text="Let us see. see above, see below, see forward, see backward, see left, see right until we will be right"; 
const count=countOccurences(text,"see "); // 2

5

Источник

user8584904 01 июн '21 в 23:15

Я думаю, что цель регулярных выражений сильно отличается от indexOf, indexOf просто найдите вхождение определенной строки, в то время как в регулярных выражениях вы можете использовать такие символы, как [A-Z] это означает, что он найдет любой заглавный символ в слове без указания фактического символа.

Пример:

 var index = "This is a string".indexOf("is");
 console.log(index);
 var length = "This is a string".match(/[a-z]/g).length;
 // where [a-z] is a regex wildcard expression thats why its slower
 console.log(length);

4

Источник

user2159605 12 мар '13 в 06:12

       var myString = "This is a string.";
        var foundAtPosition = 0;
        var Count = 0;
        while (foundAtPosition != -1)
        {
            foundAtPosition = myString.indexOf("is",foundAtPosition);
            if (foundAtPosition != -1)
            {
                Count++;
                foundAtPosition++;
            }
        }
        document.write("There are " + Count + " occurrences of the word IS");

См.:- подсчитать подстроку в строке для пошагового объяснения.

3

Источник

user4271063 19 ноя '14 в 17:13

Опираясь на @Vittim.us ответ выше. Мне нравится контроль, который дает мне его метод, что облегчает его расширение, но мне нужно было добавить регистронезависимость и ограничить совпадения целыми словами с поддержкой пунктуации. (например, "ванна" означает "принять ванну", но не "купание")

Регулярное выражение для пунктуации получено по адресу: /questions/42899019/kak-ya-mogu-udalit-vse-znaki-prepinaniya-iz-stroki-v-javascript-s-pomoschyu-regulyarnyih-vyirazhenij/42899036#42899036 ( Как я могу удалить все знаки препинания из строки в JavaScript с помощью регулярного выражения?)

function keywordOccurrences(string, subString, allowOverlapping, caseInsensitive, wholeWord)
{

    string += "";
    subString += "";
    if (subString.length <= 0) return (string.length + 1); //deal with empty strings

    if(caseInsensitive)
    {            
        string = string.toLowerCase();
        subString = subString.toLowerCase();
    }

    var n = 0,
        pos = 0,
        step = allowOverlapping ? 1 : subString.length,
        stringLength = string.length,
        subStringLength = subString.length;

    while (true)
    {
        pos = string.indexOf(subString, pos);
        if (pos >= 0)
        {
            var matchPos = pos;
            pos += step; //slide forward the position pointer no matter what

            if(wholeWord) //only whole word matches are desired
            {
                if(matchPos > 0) //if the string is not at the very beginning we need to check if the previous character is whitespace
                {                        
                    if(!/[\s\u2000-\u206F\u2E00-\u2E7F\\'!"#$%&\(\)*+,\-.\/:;<=>?@\[\]^_`{|}~]/.test(string[matchPos - 1])) //ignore punctuation
                    {
                        continue; //then this is not a match
                    }
                }

                var matchEnd = matchPos + subStringLength;
                if(matchEnd < stringLength - 1)
                {                        
                    if (!/[\s\u2000-\u206F\u2E00-\u2E7F\\'!"#$%&\(\)*+,\-.\/:;<=>?@\[\]^_`{|}~]/.test(string[matchEnd])) //ignore punctuation
                    {
                        continue; //then this is not a match
                    }
                }
            }

            ++n;                
        } else break;
    }
    return n;
}

Пожалуйста, не стесняйтесь изменять и реорганизовывать этот ответ, если вы обнаружите ошибки или улучшения.

3

Источник

user497745 28 ноя '15 в 08:02

Мы можем использовать js splitфункция, и ее длина минус 1 будет количеством вхождений.

      var temp = "This is a string.";
alert(temp.split('is').length-1);

3

Источник

balaji sukumaran 17 фев '22 в 06:47

Для любого, кто найдет этот поток в будущем, обратите внимание, что принятый ответ не всегда вернет правильное значение, если вы его обобщите, так как он захлебнется операторами регулярного выражения, такими как $ а также ., Вот лучшая версия, которая может справиться с любой иглой:

function occurrences (haystack, needle) {
  var _needle = needle
    .replace(/\[/g, '\\[')
    .replace(/\]/g, '\\]')
  return (
    haystack.match(new RegExp('[' + _needle + ']', 'g')) || []
  ).length
}

3

Источник

user435124 28 фев '15 в 22:52

Супер пупер старый, но мне нужно было сделать что-то подобное сегодня и только подумал, чтобы проверить это потом. Работает довольно быстро для меня.

String.prototype.count = function(substr,start,overlap) {
    overlap = overlap || false;
    start = start || 0;

    var count = 0, 
        offset = overlap ? 1 : substr.length;

    while((start = this.indexOf(substr, start) + offset) !== (offset - 1))
        ++count;
    return count;
};

3

Источник

user1280370 05 апр '13 в 04:16

 function substrCount( str, x ) {
   let count = -1, pos = 0;
   do {
     pos = str.indexOf( x, pos ) + 1;
     count++;
   } while( pos > 0 );
   return count;
 }

2

Источник

user235571 03 сен '20 в 16:10

function get_occurrence(varS,string){//Find All Occurrences
        c=(string.split(varS).length - 1);
        return c;
    }
    temp="This is a string.";
    console.log("Total Occurrence is "+get_occurrence("is",temp));

Используйте get_occurrence(varS,string), чтобы найти вхождение как символов, так и строки в строку.

2

Источник

user8239461 30 июн '17 в 23:29

Попытайся

<?php 
$str = "33,33,56,89,56,56";
echo substr_count($str, '56');
?>

<script type="text/javascript">
var temp = "33,33,56,89,56,56";
var count = temp.match(/56/g);  
alert(count.length);
</script>

2

Источник

user1519833 15 ноя '13 в 11:27

Простая версия без регулярных выражений:

var temp = "This is a string.";

var count = (temp.split('is').length - 1);

alert(count);