RU/EN
RU/EN

Подробное описание документа

Свидетельство о государственной регистрации программы для ЭВМ № 2020667189 Российская Федерация.
   Модуль препроцессинга неструктурированного текста с применением технологий искусственного интеллекта : № 2020666598 : заявл. 14.12.2020 : опубл. 21.12.2020 / Бородулин А. С., Нелюб В. А., Гантимуров А. П. [и др.] ; правообладатель МГТУ им. Н.Э. Баумана.

Патенты и свидетельства МГТУ им. Н.Э. Баумана

Программа предназначена для очистки текста от неинформативных признаков, таких как знаки препинания, предлоги, специальные символы и подобные элементы, в которых отсутствует информативность. Также программа осуществляет приведение к нижнему регистру шрифта, лемматизацию текста и токенизацию, создание словаря на основе модели "Bag of Words". В основе программы лежат алгоритмы искусственного интеллекта. Тип ЭВМ: IBM PC-совмест. ПК. ОС: Linux.