Кассандра падает при одновременном чтении и записи на EC2
В настоящее время мы используем кластер из 2 узлов кассандры на 2 больших инстансах EC2. Каждый из них имеет около 65G использованных данных. (То же самое для Dev и Production).
Проблема, с которой мы сталкиваемся, связана с записью в процессе производства - загрузка ЦП становится более 40 ( 2-ядерная машина), и в конечном итоге машины становятся недоступными и требуют перезагрузки. Я испробовал несколько "стратегий настройки", таких как уменьшение общего запоминаемого пространства, изменение отношения пространства Эдема к пространству выживания в молодом поколении, копирование более крупного объекта непосредственно из пространства Эдема в старшее поколение, оптимизация сжатия для более частой работы с использованием меньшего числа # из sstables (я заметил, что во время сбоя использование диска практически не было, поэтому я попытался уменьшить использование памяти).
Глядя на cassandra system.log, я не смог увидеть никаких ошибок или предупреждений. Единственное, что появляется во время сбоя, - это вывод StatusLogger.
Если я запускаю записи в кластере Dev, все идет гладко - ошибок нет, нагрузка макс. 1,5-2. Если я перезагружаю 2 производственных экземпляра, я могу некоторое время запускать операции чтения и записи, прежде чем произойдет сбой, в противном случае, учитывая, что машины работали более 2 дней, сбой происходит в течение нескольких минут.
Любые предложения, идеи будут высоко оценены.
Спасибо
1 ответ
Ссылка на первое место, по которому dmn спросил это: http://www.datastax.com/support-forums/topic/cassandra-crashes-during-simultaneous-reads-and-writes-on-ec2