Плюсы и минусы использования Lucidworks Fusion вместо обычного Solr
Я хочу знать, какие плюсы и минусы используют Fusion вместо обычного Solr? Ребята, можете ли вы привести какой-то пример (например, проблему, которую легко решить с помощью Fusion)?
2 ответа
Прежде всего, я должен сообщить, что я менеджер по продукту Lucidworks Fusion.
Похоже, вы уже знаете, что Fusion работает с Solr (или с одним или несколькими кластерами или экземплярами Solr), используя Solr для хранения данных и запросов. Цель Fusion - упростить использование Solr, интегрировать Solr и создать сложные решения, использующие Solr. Fusion предоставляет некоторые вещи, которые многие считают полезными для этого:
- Разъемы и соединительная рамка. Bare Solr дает вам хороший API и возможность помещать определенные типы файлов в командную строку. Fusion поставляется с несколькими предварительно созданными коннекторами источников данных, которые извлекают данные из различных типов систем, обрабатывают их соответствующим образом (включая анализ, преобразование и отображение полей) и отправляют результаты в Solr. Эти соединители включают в себя общие хранилища документов (облачные и локальные), реляционные базы данных, хранилища данных NoSQL, HDFS, корпоративные приложения и очень мощный и настраиваемый веб-сканер.
- Интеграция безопасности. Solr не имеет никакой аутентификации или авторизации (хотя начиная с версии 5.2 на этой неделе он имеет подключаемый API и базовую реализацию Kerberos для аутентификации). Fusion оборачивает Solr API защищенной версией. Fusion имеет чистую интеграцию в LDAP, Active Directory и Kerberos для аутентификации. Он также имеет детализированную модель авторизации для управления и настройки Fusion и Solr. Кроме того, модель авторизации Fusion может автоматически связывать членство в группах из LDAP/AD со списками контроля доступа из источников данных Fusion Connectors, так что вы получаете контроль доступа на уровне документа, отраженный от ваших исходных систем при выполнении поисковых запросов.
- Модель обработки трубопроводов. Fusion предоставляет конвейерную модель с модульными этапами (как в форме API, так и в форме GUI), чтобы упростить определение и редактирование преобразований данных и документов. Это аналог unix shell pipe. Например, при индексации вы можете включать этапы для определения отображений полей, вычисления новых полей, агрегирования документов, извлечения данных из других источников и т. Д. Перед записью в Solr. При запросе вы можете сделать то же самое, преобразовать запрос, запустить и вернуть результаты другой аналитики и применить фильтрацию безопасности.
- Admin GUI. Fusion имеет веб-интерфейс для просмотра и настройки вышеуказанного (а также базовую конфигурацию Solr). Мы думаем, что это удобно для людей, которые хотят использовать Solr, но не используют его достаточно регулярно, чтобы помнить, как использовать API, файлы конфигурации и инструменты командной строки.
- Сложные функции на основе поиска. Используя описанную выше модель конвейеров, Fusion включает (и упрощает использование) некоторые более богатые компоненты на основе поиска, в том числе: модули обработки естественного языка и извлечения сущностей; Регулирование релевантности на основе сигналов в реальном времени. Мы намерены предоставить больше из них в будущем.
- Обработка аналитики: Fusion включает в себя и интегрирует Apache Spark для проведения глубокой аналитики данных, хранящихся в Solr (или на пути к Solr). Хотя Solr неявно включает в себя определенные возможности анализа данных, это не является его главной целью. Мы используем Apache Spark, чтобы управлять извлечением сигналов Fusion и настройкой релевантности, и рассчитываем представить API-интерфейсы, чтобы пользователи могли легко запускать там другую обработку.
- Другое: много полезных различных функций, таких как: интерфейс приборной панели; простой пользовательский интерфейс поиска с ручной настройкой релевантности; более легкий мониторинг; управление работой и планирование; оповещение в режиме реального времени с интеграцией электронной почты и многое другое.
Многое из вышеперечисленного, конечно, может быть построено или написано для Solr без Fusion, но мы считаем, что обеспечение такого рода интеграции предприятий будет полезным для многих людей.
Плюсы:
- Соединители: Lucidworks предоставляет вам широкий спектр соединителей, с помощью которых вы можете подключаться к источникам данных и извлекать данные оттуда.
- Повторное использование: в Lucidworks вы можете создавать конвейеры для приема и извлечения данных. Вы можете создавать конвейеры с общей логикой, чтобы их можно было использовать в других конвейерах.
- Безопасность: Вы можете накладывать ограничения на данные, т.е. на данные обрезания безопасности. Lucidworks предоставляет встроенные этапы конвейера запросов для обрезки безопасности, или вы можете написать собственный конвейер для своего варианта использования.
- Устранение неполадок: Lucidworks поставляется с отдельными службами, такими как API, соединители, Solr. Вы можете устранить любую проблему в зависимости от службы, у каждой службы есть свои журналы. Также вы можете настроить свойства JVM для каждой службы.
- Поддержка: Служба поддержки Lucidworks доступна круглосуточно и без выходных. Вы можете создать запрос в службу поддержки в соответствии с серьезностью, и они запланируют звонок для вас.
Минусы:
- Не так много, но это удерживает вас от обычной разработки, у вас не так много шансов открыть свою IDE и начать кодирование.