Подробное описание документа
Сафронов Н. С.
Mamba: эффективная обработка длинных последовательностей в NL2Code / Сафронов Н. С., Белов Ю. С. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции, Калуга, 15-17 апреля 2025 года : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2026. - Т. 2. -
Задачи генерации программного кода на основе естественного языка (NL2Code) сталкиваются с проблемой обработки длинных и сложных последовательностей, таких как вложенные алгоритмы или многофайловые проекты. Традиционные архитектуры, включая трансформеры, демонстрируют ограниченную эффективность из-за квадратичной вычислительной сложности механизма внимания. Представлен архитектурный подход Mamba, основанный на модифицированных State-Space Models (SSM), который решает эти проблемы за счет линейной сложности, динамического управления контекстом и адаптивного позиционного кодирования.
Ключевые слова: архитектура Mamba, NL2Code, State-Space Models, линейная вычислительная сложность, динамическое управление контекстом, адаптивное позиционное кодирование, генерация программного кода
004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, основанные на использовании знаний
Статья опубликована в следующих изданиях
Т. 2. - 2026. - 449 с. : ил. - Библиогр.