Ядро Lucene и Solr обновлены до 3.3


Новые версии Lucene Core и Solr теперь доступны в проекте Apache Lucene.

Проект Apache Lucene представляет собой набор программного обеспечения для поиска с открытым исходным кодом, состоящего из ядра Lucene, Solr, PyLucene и проекта Open Relevance.

Lucene Core, ранее Lucene Java,-это инструмент индексирования и поиска на основе Java, который также предлагает проверку орфографии, выделение хитов и расширенные возможности анализа/токенизации.

Solr-это корпоративный поисковый сервер с рядом API и функций поиска, включая фасетный и распределенный поиск, а также интерфейсы администратора и поиска. PyLucene – это порт Python основного проекта Lucene.

Новая версия Lucene (3.3) имеет улучшенную проверку орфографии, поддержку слияния результатов из нескольких осколков и оптимизированную реализацию KStem, менее агрессивного стеммера для английского языка. Проверка орфографии теперь содержит предложения для слов с ошибками и предлагает автоматическое заполнение слов. Он имеет три реализации: Jaspell, Ternary Trie и Конечное состояние.

Новая опция под названием NRTManager упрощает обработку поиска почти в реальном времени с несколькими потоками поиска, позволяя приложению контролировать, какие изменения индексации должны быть видны для каких поисковых запросов.

Solr 3.3 имеет улучшения, включая возможность сворачивать группы и поля; реализация автоматического предложения/автозаполнения, о которой говорится в примечаниях к выпуску, обеспечивает на порядок меньшее потребление оперативной памяти. Solr теперь также по умолчанию использует более эффективную политику слияния (TieredMergePolicy), которая делает индексацию более эффективной. 

Для получения полного списка новых функций в Lucene и Solr, а также для загрузки программного обеспечения посетите сайт проекта Lucene.


Добавить комментарий