Параметры поиска Azure (понял ли я поиск Azure prcicng)
У нас есть 100 миллионов строк в табличном хранилище, каждая строка содержит около 4 элементов метаданных, мы хотели бы искать по метаданным, учитывая, что цены будут очень дорогими.
Опция Basic поддерживает документы 1M, это то же самое, что 1 миллион строк только с 4 элементами метаданных? Или мы просто использовали бы хранилище объемом 2 ГБ, которое было бы оптимизировано, поэтому 2 ГБ метаданных могут не = 2 ГБ памяти.
И тогда больший размер
Мы также смотрим на Document DB и стандартный шаблон с табличным хранилищем, чтобы разрешить поиск по другим метаданным.
2 ответа
Basic имеет жесткое ограничение в 1M документа, и вы не можете добавить больше разделов, чтобы увеличить его, поэтому вам нужно перейти на один из стандартных уровней S1, S2 или S3, если вы хотите проиндексировать все записи 100M. Каждая отдельная запись (строка в вашей базе данных) считается документом. Максимальный размер индексируемых документов составляет 16 МБ, но он может быть меньше в зависимости от того, как вы обновляете индекс ( https://docs.microsoft.com/en-us/azure/search/search-limits-quotas-capacity).
Количество документов, которые необходимо сохранить, влияет на то, какой уровень вам нужен, а также на максимальный размер хранилища и желаемую пропускную способность. Вы можете быстро оценить, насколько большим должен быть размер вашего хранилища, например, если все ваши 4 точки метаданных являются строковыми, а каждая строка в среднем содержит 30 символов UTF-8, тогда вам нужно всего (100M x 4 x 30 b) ~ 11 ГБ, поэтому размер хранилища, скорее всего, не будет тем, что вам нужно для выбора большего количества разделов (как S1, так и S2 могут вписаться в один раздел).
Для размещения 100 миллионов документов вы можете использовать 7 разделов S1 (15M x 7 = 105 млн.) По цене 1304,21 фунтов стерлингов в месяц или 2 раздела S2 (100M x 2) по цене 1 490,52 фунтов стерлингов в месяц. S2, скорее всего, даст вам лучшую пропускную способность и даст вам больше индексов для работы (даже если они вам сейчас не нужны (поскольку у вас есть только 4 точки метаданных).
Как отмечалось ранее, полные возможности поисковой системы могут быть намного больше, чем вам нужно сейчас, но если это стратегическое решение, чтобы начать работать с ним, то, по крайней мере, вы знаете, почему вы платите за это.
Если в ваших сценариях поиска не требуется полнотекстовый поиск (например, ввод текста вперед, предложения, основанные на словах и наклонные формы слов на более чем 50 языках, фасетах, настраиваемом скоринге), а вместо этого нужны только числовые / datetime / геопространственные сравнения и простое соответствие строк, тогда DocumentDB будет хорошим выбором. DocumentDB также легко интегрируется с поиском Azure, если / когда вам нужны возможности полнотекстового поиска.
С точки зрения цен поиска Azure посмотрите на уровни S1 и S2. Например, вы можете хранить 100 миллионов документов с двумя разделами S2. Пределы хранения и документов, указанные на ценовых листах, указаны для каждого раздела. Каждый сервис может иметь до 12 разделов, кроме основного, который имеет только 1.