TextTeaser с открытым исходным кодом


TextTeaser, приложение, которое использует обработку естественного языка и машинное обучение для автоматического суммирования текста, было с открытым исходным кодом.

Лучший способ оценить эффективность TextTeaser-это попробовать его. Вы можете либо скопировать и вставить текст в окно, которое он предоставляет, либо просто ввести URL – адрес статьи-не стесняйтесь попробовать это с помощью одной из наших новостей.

После того, как он быстро создал сводку по пунктам, вы можете поделиться ссылкой на нее в виде текста или изображения, или вы можете использовать код встраивания, чтобы добавить ее на веб-страницу.

(нажмите, чтобы увеличить)

Как объяснил его соавтор Джоло Балбин в интервью для Programmable Web, он начал работу над алгоритмом в рамках своей аспирантуры и очень хочет превратить его в реальное приложение. В рамках своих исследований он провел тесты, чтобы сравнить свой алгоритм с другими, которые выполняли автоматическое суммирование, и обнаружил, что он работает лучше. Поскольку он использует машинное обучение в сочетании с НЛП (Программирование на естественном языке), его производительность улучшится по мере обобщения большего количества статей.

API TextTeaser и его документация теперь находятся на Mashape, с опциями Freemium и подписки. Для тех, кто хочет принять участие в проекте, код находится на GitHub под лицензией MIT. Для этого требуется инструмент сборки sbt, и рекомендуется использовать среду разработки Scala IDE.


Добавить комментарий