Описание тега clustering-key

1 ответ

Cassandra Data Моделирование и проектирование кластеризации

Я немного запутался в разработке модели данных для Cassandra, исходя из фона SQL! Я прошел Datastax документация несколько раз, чтобы понять многое о Кассандре! Кажется, это проблема, и я не уверен, как я могу преодолеть это и тип модели данных, кот…
0 ответов

Вывод Doc2vec: получить наиболее похожие результаты для всех данных

У меня есть 120 строк текстовых (предложений) данных, чтобы сгруппировать или классифицировать их. Используя doc2vec в Gensim, я создал модель в соответствии с приведенным ниже кодом: model = gensim.models.doc2vec.Doc2Vec(size=50, min_count=2, iter=…
2 ответа

Какой алгоритм кластеризации подходит для кластеризации географических местоположений?

Я занимаюсь разработкой приложения, которое работает аналогично Tinder. Я предполагаю, что Tinder группирует самые близкие результаты, запустив алгоритм кластеризации. В моем приложении необходимо аналогичным образом сгруппировать данные на основе г…
24 май '16 в 04:49
0 ответов

Кассандра - Сортировка данных для решения нумерации страниц?

Итак, у нас есть веб-приложение, использующее.NET с комбо Cassandra / Spark для создания онлайн-отчетов. В настоящее время мы собираем все релевантные данные из Cassandra и отображаем их внутри таблицы через плагин JavaScript, который также сортируе…
4 ответа

Алгоритм кластеризации для измерений средней энергии

У меня есть набор данных, который состоит из точек данных, имеющих такие атрибуты, как: среднесуточное потребление энергии среднесуточная выработка энергии тип источника энергии среднесуточная энергия, подаваемая в сеть ежедневный тариф на электроэн…
30 май '15 в 09:56
1 ответ

Производительность Cassandra с использованием предложения IN для ключей кластеризации

Давайте рассмотрим следующую таблицу CREATE TABLE base_table( partition_key uuid, clustering_key1 uuid, clustering_key2 uuid, regular text, PRIMARY KEY((partition_key), clustering_key1, clustering_key2) ); До Cassandra 2.2 не было возможности делать…
16 мар '18 в 11:01
1 ответ

Каков эффект включения столбца "включить" в некластеризованный индекс, который уже является частью ключа кластеризации?

Предположим, я разбил таблицу на (RetailerID, PurchaseDate, UserID). Это "ключ кластеризации", и ключи кластеризации всегда включены во все некластеризованные индексы. /questions/33290858/kak-neklasterizovannyij-indeks-mozhet-vyivodit-stolbets-kotor…
1 ответ

Выполнение запроса только с ключом раздела

Влияет ли это на производительность, если при запросе таблицы, содержащей как ключ раздела, так и ключ кластеризации, я предоставляю только ключ раздела? Например, для таблицы с ключом раздела p1 и ключом кластеризации c1, будет SELECT * FROM table1…
30 июл '18 в 10:23
1 ответ

Cassandra моделирование с состоянием чтения / непрочитанного для входящих сообщений, CQL

Я пытаюсь найти лучшую модель данных для приложения окна сообщения. Эти сообщения появляются в том порядке, в котором сначала появляются "непрочитанные", а затем, когда пользователь прокручивает, появляются "прочитанные" сообщения. В обеих категория…
1 ответ

Дескриптор файла потока Cassandra TimeUUID при использовании uuid по умолчанию

У меня есть модель Кассандры как import uuid from cassandra.cqlengine import columns from cassandra.cqlengine.models import Model class MyModel(Model): ... ... created_at = columns.TimeUUID(primary_key=True, clustering_order='DESC', default=uuid.uui…
05 май '17 в 14:19
0 ответов

K-средства для кластеризации изображений и матрицы путаницы

У меня есть изображение для анализа, как это: и я должен использовать K-Means с 5 кластерами на этом изображении. После того, как я получу метки и центроиды, как я могу получить матрицу смешения, если я знаю количество пикселей одного цвета? это мой…
1 ответ

Изменение ключа кластеризации в существующей таблице - SQL Server 2008

Мне передали задачу улучшить производительность запросов для таблицы. Первичный ключ является GUID он создается кодом приложения, поэтому не является последовательным, и в таблице нет отдельного ключа последовательной кластеризации. Я чувствую, что …
1 ответ

Абстрактная модель Кассандры не может определить primary_key с порядком кластеризации

Я создаю модели Cassandra в Python, ниже мой код from uuid import uuid4 from uuid import uuid1 from cassandra.cqlengine import columns, connection from cassandra.cqlengine.models import Model from cassandra.cqlengine.management import sync_table cla…
23 дек '16 в 15:30
1 ответ

Сортировка Кассандры и изменяющийся ключ кластеризации

У меня есть вопрос моделирования данных для случаев, когда данные должны быть отсортированы по ключам, которые могут быть изменены. Итак, скажем, у нас есть таблица пользователей { dept_id text, user_id text, user_name text, mod_date timestamp PRIMA…
06 апр '17 в 12:44
1 ответ

Кассандра - запрос на кластеризацию ключей

Я только начинаю на Cassandra, и я пытался создать таблицы с разными ключами разделов и кластеров, чтобы увидеть, как их можно запрашивать по-разному. Я создал таблицу с первичным ключом вида - (a),b,c, где a - ключ раздела, а b, c - ключ кластериза…
27 май '15 в 15:31
1 ответ

Конфигурация экземпляров WSO2

Я пытаюсь настроить экземпляры API Worker-Manager с помощью wso2am-2.0.0, Я не создал базы данных и не сделал никаких конфигураций, связанных с тем же. Однако, пока я управляю bin/wsoserver.sh выдает ошибки базы данных org.h2.jdbc.JdbcSQLException: …
06 дек '16 в 05:24
1 ответ

Определить пользовательский компаратор для столбца кластеризации Кассандры

Есть ли способ для меня использовать пользовательскую функцию компаратора для сортировки ключа кластеризации в Кассандре. Мое определение таблицы похоже на следующее: CREATE TABLE temp (user_id text, data_id int, data text, PRIMARY KEY(user_id, data…
1 ответ

Порядок кластеризации Cassandra CQL3 и разбиение на страницы

Я создаю сервис избранного пользователя с помощью Cassandra. Я хочу иметь возможность сортировать избранное по последним, а затем разбивать на страницы по track_ids, т. Е. Внешний интерфейс отправляет обратно последний track_id на странице 200. CREA…
25 июл '16 в 12:19
0 ответов

Определение функции, которая автоматизирует создание кластерной диаграммы k-средних, принимая 3 аргумента

У меня есть различные строки кода для создания кластерной диаграммы k-средних. Вместо того, чтобы повторять код для различных наборов данных, я хотел создать функцию, которая автоматизирует это. Я предполагал, что это будет работать, имея 3 аргумент…
1 ответ

Анализ настроений для оценки продукта

Привет, я работаю над проектом, основанным на анализе настроений для оценки продукта. У меня есть набор данных для хороших слов и отрицательных слов. Когда какой-либо пользователь комментирует на сайте продукт, он автоматически оценивается из 10, по…
06 фев '17 в 04:54