ИСТИНА |
Войти в систему Регистрация |
|
ФНКЦ РР |
||
Существует множество полногеномных протоколов, которые позволяют находить взаимодействия биологических макромолекул друг с другом, и РНК-хроматиновые взаимодействия не являются исключением. Контакты РНК с хроматином изучают в двух режимах: методы «один-против-всех» направлены на поиск контактов единичной РНК со всем геномом, тогда как методы «все-против-всех» позволяют определить взаимодействия любой РНК со всем геномом [1]. Ключевым этапом анализа данных «один-против-всех» и «все-против-всех» является поиск значимых РНК-хроматиновых взаимодействий («пиков») и исследование функциональной роли молекул РНК, исходя из их локализации на хроматине. На данный момент не существует универсального инструмента, который позволил бы единообразно находить специфические контакты РНК с хроматином с учетом вносимых искажений и высокого уровня шума в данных. Мы разработали универсальный инструмент BaRDIC (Binomial RNA-DNA Interaction Caller), который использует частотный подход для выявления пиков РНК-хроматиновых взаимодействий, как в данных «все-против-всех», так и в данных «один-против-всех». Данный подход учитывает искажения, которые наблюдаются в данных РНК-ДНК интерактома, такие как различная доступность хроматина и скейлинг — эффект убывания плотности РНК-хроматиновых контактов при удалении локуса ДНК от гена, с которого идет транскрипция. Алгоритм принимает на вход данные о фоновых взаимодействиях, которые могут быть получены из контрольного эксперимента. Кроме того, алгоритм может строить фоновую модель из самих данных в предположении, что транс-контакты мРНК в основном не привлекаются к хроматину специфично. Другим преимуществом предложенного метода является индивидуальный подбор размера бина для каждой РНК, что позволяет учесть особенности контактирования различных РНК. С помощью этого подхода можно повысить разрешение при анализе контактов РНК с «родной» хромосомой. Кроме того, алгоритм может устанавливать широкие бины, что особенно важно при выявлении сигнала в разреженных данных. Контакты для ряда экспериментов «все-против-всех» и «один-против-всех», обработанные по единому протоколу, были взяты из базы данных RNA-Chrom [2]. Качество полученных пиков оценивали путем их соотнесения с пиками из экспериментов «один-против-всех», полученных алгоритмом MACS2 на тех же клеточных линиях. Разработанный метод поиска пиков в данных РНК-ДНК интерактома, BaRDIC, хорошо воспроизводит подвыборку пиков из публичных данных «один-против-всех» с учетом разреженности данных. Учет скейлинга позволяет более аккуратно находить места связывания РНК на родительской хромосоме. Подбор размера бина, который реализован в алгоритме BaRDIC, позволяет находить места связывания как для часто контактирующих, так и для редко контактирующих РНК. Кроме того, с помощью нового алгоритма удалось подтвердить свойства контактов хроматин-ассоциированных РНК, описанных в литературе. Исследование выполнено при финансовой поддержке гранта РНФ №23-14-00136.