Разработан программный комплекс в виде библиотеки для глубокого иерархического обучения интеллектуальных агентов для arm процессоров. Интеллектуальные агенты должны будут «научиться» перемещаться в заранее неизвестной для них среде, модель которой изначально не будет строго детерминированной для агентов, накапливая опыт в процессе множества итераций, получая за свои действия положительные или отрицательные вознаграждения от среды, коммуницировать между собой путем передачи сообщений о своих перемещениях другим агентам группы, с целью оптимизации своих траекторий для достижения целевого состояния заданного оператором.
Для иллюстрации работы программного кода библиотеки выбрано семейство процессоров STM32 серии STM32F4 на базе архитектуры ARM Cortex-M4 модель STM32F407 (или плата с STM32F429) разрядностью 32bit.
В результате тестирования, агенты, постепенно «обучаясь» должны будут найти выход из лабиринта и переместиться в него (целевое терминальное состояние) найдя субоптимальные траектории из некоторого множества оптимальных.
Ядро библиотеки разработано на языке С (как наиболее быстром и простом языке для разработки программного обеспечения, зависимого от аппаратной части), для прототипирования возможно использование языка Python.
Проект можно найти на
GitHubПроект реализован при поддержке Фонда содействия инновациям (
ФСИ) в рамках программы Код - Искусственный интеллект