IBM инвестирует 100 миллионов долларов в исследования и разработки в области больших данных

Потребность в улучшенных инструментах для анализа больших неструктурированных наборов данных побудила IBM объявить об инвестициях в размере 100 миллионов долларов в исследования и разработки для способов управления и использования неструктурированных данных.

.NET ORM Dapper выпущен с открытым исходным кодом

Если ваш веб-сайт сильно нагружает необходимость преобразовывать запросы в запросы и возвращать результат из базовой базы данных SQL, Dapper, новый инструмент с открытым исходным кодом может предоставить решение.

Бесплатная книга по веб-майнингу

Учебник Mining of Massive Datasets, написанный для продвинутого курса аспирантуры, преподаваемого в Стэнфордском университете, был предоставлен для бесплатного скачивания его авторами, Анандом Раджармой и Джеффри Д. Уллманом.

ScraperWiki освобождает данные теперь с поддержкой PDF

Возможно, вы пропустили ScraperWiki — это одна из тех действительно хороших идей, которые, как правило, остаются скрытыми в безвестности. Последней функцией является конвертер PDF в HTML, что делает его еще более интересным.