GetContentUniqueness

Mar 6, 2011 at 12:33 PM

Огромное спасибо за библиотеку! Реально от большого количества рутины избавила. 

Подскажите, как работает эта функция - GetContentUniqueness? И вообще, где бы описание к ним хотя бы краткое посмотреть?

Coordinator
Mar 14, 2011 at 11:51 AM

Она разбивает документы на предложения и находит дублирующиеся предложения - потом высчитывает процентное соотношение предложений которые дублируются. Для более сложного стравнения необходимо использовать метод шинглов.

Готовлю документацию и описания use cases, в разделе documentation уже понемногу начинают появляться материалы.

материалы материалы