Алгоритмы поиска шаблонов в NodeJS

Я работаю на сервере, который будет обновлять список каждый день. Список будет выглядеть следующим образом.

+---+------------+-------------+-------------+-------------+
|   |     A      |      B      |      C      |      D      |
+---+------------+-------------+-------------+-------------+
| 1 | Name1      |      1      |      2      |     true    |
| 2 | Name2      |      2      |      3      |     true    |
| 3 | Name3      |      1      |      1      |     false   |
+---+------------+-------------+-------------+-------------+

В этом примере я использовал только 2 таблицы (кроме имени), но в реальном списке 15 столбцов, каждый из которых содержит другие числа (некоторые столбцы также могут иметь одинаковое значение).

У меня также есть последний столбец, который заполнен значением true или false. Этот столбец будет заполнен на следующий день, когда я получу другие значения.

То, что я хочу запрограммировать, - это алгоритм, который сможет искать шаблоны, которые наиболее распространены для всех строк со значением true.

Я хочу запрограммировать это в NodeJS, но понятия не имею, как я могу это сделать, есть идеи?

1 ответ

Рассматриваемый алгоритм получен из предыдущих сохраненных значений различных столбцов, которые соответствуют последнему столбцу, являющемуся истинным. Если мы рассмотрим линейные отношения между различными столбцами, такими как

y=a1*c1+a2*c2...+a14*c14

где c1 - столбец 1, а a1 - коэффициент. Затем, например, мы "можем" получить какое-то отношение, подобное.

y>0.5 then true
y<0.5 then false

но замечания

  1. это будет справедливо только в том случае, если между столбцами существует линейная связь.
  2. Это будет нечеткая кластеризация, т. Е. Могут быть выбросы, когда вы вычисляете истину или ложь с помощью приведенного выше уравнения.
  3. Между значениями столбцов может существовать некоторая нелинейная зависимость, которая может не охватываться приведенными выше соотношениями.
Другие вопросы по тегам