Новые версии Lucene Core и Solr теперь доступны в проекте Apache Lucene.
Проект Apache Lucene представляет собой набор программного обеспечения для поиска с открытым исходным кодом, состоящего из ядра Lucene, Solr, PyLucene и проекта Open Relevance.
Lucene Core, ранее Lucene Java,-это инструмент индексирования и поиска на основе Java, который также предлагает проверку орфографии, выделение хитов и расширенные возможности анализа/токенизации.
Solr-это корпоративный поисковый сервер с рядом API и функций поиска, включая фасетный и распределенный поиск, а также интерфейсы администратора и поиска. PyLucene — это порт Python основного проекта Lucene.
Новая версия Lucene (3.3) имеет улучшенную проверку орфографии, поддержку слияния результатов из нескольких осколков и оптимизированную реализацию KStem, менее агрессивного стеммера для английского языка. Проверка орфографии теперь содержит предложения для слов с ошибками и предлагает автоматическое заполнение слов. Он имеет три реализации: Jaspell, Ternary Trie и Конечное состояние.
Новая опция под названием NRTManager упрощает обработку поиска почти в реальном времени с несколькими потоками поиска, позволяя приложению контролировать, какие изменения индексации должны быть видны для каких поисковых запросов.
Solr 3.3 имеет улучшения, включая возможность сворачивать группы и поля; реализация автоматического предложения/автозаполнения, о которой говорится в примечаниях к выпуску, обеспечивает на порядок меньшее потребление оперативной памяти. Solr теперь также по умолчанию использует более эффективную политику слияния (TieredMergePolicy), которая делает индексацию более эффективной.
Для получения полного списка новых функций в Lucene и Solr, а также для загрузки программного обеспечения посетите сайт проекта Lucene.