Алгоритмы поиска шаблонов в NodeJS
Я работаю на сервере, который будет обновлять список каждый день. Список будет выглядеть следующим образом.
+---+------------+-------------+-------------+-------------+
| | A | B | C | D |
+---+------------+-------------+-------------+-------------+
| 1 | Name1 | 1 | 2 | true |
| 2 | Name2 | 2 | 3 | true |
| 3 | Name3 | 1 | 1 | false |
+---+------------+-------------+-------------+-------------+
В этом примере я использовал только 2 таблицы (кроме имени), но в реальном списке 15 столбцов, каждый из которых содержит другие числа (некоторые столбцы также могут иметь одинаковое значение).
У меня также есть последний столбец, который заполнен значением true или false. Этот столбец будет заполнен на следующий день, когда я получу другие значения.
То, что я хочу запрограммировать, - это алгоритм, который сможет искать шаблоны, которые наиболее распространены для всех строк со значением true.
Я хочу запрограммировать это в NodeJS, но понятия не имею, как я могу это сделать, есть идеи?
1 ответ
Рассматриваемый алгоритм получен из предыдущих сохраненных значений различных столбцов, которые соответствуют последнему столбцу, являющемуся истинным. Если мы рассмотрим линейные отношения между различными столбцами, такими как
y=a1*c1+a2*c2...+a14*c14
где c1 - столбец 1, а a1 - коэффициент. Затем, например, мы "можем" получить какое-то отношение, подобное.
y>0.5 then true
y<0.5 then false
но замечания
- это будет справедливо только в том случае, если между столбцами существует линейная связь.
- Это будет нечеткая кластеризация, т. Е. Могут быть выбросы, когда вы вычисляете истину или ложь с помощью приведенного выше уравнения.
- Между значениями столбцов может существовать некоторая нелинейная зависимость, которая может не охватываться приведенными выше соотношениями.