О поиске эквивалентных текстов

3.45 из 5, отдано 19 голосов

Д. С. Бухаров

В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых систем Интернета. В подходе, представленном в статье, учитывается ряд особенностей: частотность слов, пунктуация, морфемная структура слов, регистр букв и артефакты текста (специфические цифро-буквенные сочетания). Разработанная программа протестирована на наборе данных, в число которых включены как оригиналы текстов, так и их специальным образом модифицированные варианты. В результате проведенного эксперимента определены слабые стороны подхода. Приведены варианты по улучшению разработанного программного средства и схема взаимодействия модулей разработанной программы после модификации.

Категория: программы

Правообладатель: Синергия

Год: 2016

Легальная стоимость: 202.00 руб.

Ограничение по возрасту: 0+

О поиске эквивалентных текстов

Д. С. Бухаров

Читать книгу «О поиске эквивалентных текстов» онлайн:

Комментарии ():

О поиске эквивалентных текстов

Д. С. Бухаров

Читать книгу «О поиске эквивалентных текстов» онлайн:

Комментарии ():

Вам также может понравиться:

Компьютерное моделирование надежности зон сварных соединений магистральных газопроводов

Д. О. Буклешев

Fundamentals and Methods of Machine and Deep Learning

Pradeep Singh

Beginning Flutter

Marco L. Napoli

Financial Modeling in Excel For Dummies

Danielle Stein Fairhurst