Подробное описание документа
Свидетельство о государственной регистрации программы для ЭВМ № 2020667189 Российская Федерация.
Модуль препроцессинга неструктурированного текста с применением технологий искусственного интеллекта : № 2020666598 : заявл. 14.12.2020 : опубл. 21.12.2020 / Бородулин А. С., Нелюб В. А., Гантимуров А. П. [и др.] ; правообладатель МГТУ им. Н.Э. Баумана.
Программа предназначена для очистки текста от неинформативных признаков, таких как знаки препинания, предлоги, специальные символы и подобные элементы, в которых отсутствует информативность. Также программа осуществляет приведение к нижнему регистру шрифта, лемматизацию текста и токенизацию, создание словаря на основе модели "Bag of Words". В основе программы лежат алгоритмы искусственного интеллекта. Тип ЭВМ: IBM PC-совмест. ПК. ОС: Linux.