Разработка анализирует последовательность поэтапно: сначала определяет границы участков, затем проверяет их структуру и классифицирует, отделяя экзоны от интронов. Такой подход позволяет нейросети распознавать не только белок-кодирующие фрагменты, но и сложные для анализа гены длинных некодирующих РНК. Точность здесь критична, ведь ошибка даже в один нуклеотид искажает структуру белка из-за сдвига рамки считывания.
Технология особенно эффективна для работы с «немодельными» организмами, чьи геномы часто представлены лишь «сырыми» данными без аннотаций. Во время испытаний модель, обученная на генах человека и 38 видов млекопитающих, успешно справилась с анализом ДНК плодовой мушки, дрожжей и растений. Система также научилась выявлять редкие «ядовитые» экзоны, провоцирующие деградацию РНК. Сейчас разработчики открыли доступ к модели на платформе Hugging Face и запустили лидерборд для сравнения результатов с другими решениями.
Комментарии (0)
Пока нет комментариев. Будьте первым!