Версия 7.70 линейки продуктов dtSearch сейчас находится в стадии бета-тестирования. В новой версии добавлены улучшения в фильтры документов, в том числе выделение попаданий на изображения, а также текст в документах Office и сообщениях электронной почты.
Собственные фильтры документов dtSearch поддерживают широкий спектр типов данных (многие из которых уже включают поддержку комбинированного изображения и текста). Полный список в новой бета-версии
«Офисные» документы: MS Office, OpenOffice, RTF, PDF и т. Д. В бета-версии также добавлена поддержка японских документов Ichitaro.
Электронная почта: MS Exchange, Outlook, Thunderbird и т. Д., Все с вложенными вложениями.
Форматы сжатия: ZIP, RAR, GZIP / TAR и др.
Готовые к работе в Интернете данные: HTML, XML / XSL и PDF — уже с полной поддержкой изображений (в дополнение к тексту)
Динамические данные: PHP, ASP.NET, SharePoint и т. Д. — уже с полной поддержкой изображений (в дополнение к тексту)
Базы данных: SQL, включая данные BLOB (через API dtSearch Engine), MS Access, XBASE, XML, CSV и т. Д.
Фильтры документов поддерживают синтаксический анализ всех этих типов данных, а также извлечение текста и / или преобразование в HTML, как это требуется для отображения в браузере с выделенными совпадениями. Новая бета-версия расширяет фильтры документов, добавляя поддержку изображений в Word (.doc / .docx), PowerPoint (.ppt / .pptx), Excel, (.xls / .xlsx), Access (.mdb / accdb), RTF, и файлы электронной почты, включая файлы Thunderbird (mbox / .eml) и Outlook (.pst / .msg). Бета-версия отображает эти форматы, показывая выделенные совпадения в контексте как с текстом, так и с изображениями.
Фильтры документов также поддерживают документы и изображения в многоуровневых вложенных конфигурациях. Например, новая бета-версия поддерживает просмотр изображений на слайде PowerPoint, встроенном в документ Word, прикрепленный в виде заархивированного файла к сообщению электронной почты. Новый API «извлечения объектов» позволяет разработчикам перемещаться по структуре каждого встроенного объекта в виде иерархии и, при необходимости, извлекать каждый объект.
DtSearch Spider, доступный через .NET API, работает с локальным и удаленным, статическим и динамическим веб-контентом. Поиск с выделением попаданий может охватывать любой уровень глубины сайта, любое количество общедоступных, частных или защищенных сайтов, включая поддержку входа в систему и аутентификации на основе форм.
dtSearch Engine для Win и .NET и dtSearch Engine для Linux делают доступными фильтры документов dtSearch и мгновенный поиск для широкого спектра приложений в Интернете, интрасети и других коммерческих приложениях. Пакеты SDK включают собственные 64-разрядные и 32-разрядные API-интерфейсы C ++, Java и .NET (до 4.x). Новый выпуск также охватывает dtSearch Web with Spider для быстрой публикации мгновенно доступных для поиска данных на сайте в Интернете или интранете; dtSearch Network with Spider для мгновенного поиска в сети; dtSearch Publish для публикации данных с возможностью поиска на портативных носителях и dtSearch Desktop с Spider для поиска на рабочем столе.