Cовременные методы кластеризации и визуализации для анализа баз данных кристаллических структурНИР

Modern clustering and visualisation techniques for crystallographic database analysis

Источник финансирования НИР

грант РНФ

Этапы НИР

# Сроки Название
1 30 июня 2022 г.-30 июня 2023 г. Cовременные методы кластеризации и визуализации для анализа баз данных кристаллических структур I
Результаты этапа: На примере 2765 координационных полиэдров девяти металлов с КЧ 5 была продемонстрирована возможность использования современных методов машинного обучения без учителя для визуализации кристаллографических данных. На использованном наборе данных метод t-SNE (t-distributed stochastic neighbor embedding, стохастические вложения соседей с распределением Стьюдента) позволял выделить различные типы координационного окружения включая тригональную бипирамиду, тетрагональную пирамиду, и 4+1 окружение с центральным атомом в центре плоского квадрата, характерное для меди II. На том же самом наборе данных ранее применявшийся линейный метод понижения размерности PCA (principal component analysis, анализ главных компонент) 5233 координационных полиэдра лантанидов состава MO8 из Кембриджской базы структурных данных проанализированы с помощью современного метода машинного обучения без учителя UMAP (Uniform Manifold Approximation and Projection). Результаты геометрического кластерного анализа сопоставлены с результатами наиболее распространённого метода анализа координационных полиэдров — непрерывного измерения формы. Показана применимость нового метода для классификации координационных окружений, включающих бидентатные лиганды с малым «углом укуса» (bite angle), анализ которых с применением известных ранее методов затруднён. По результатам анализа принята к публикации статья в журнале "Известия Академии Наук, серия химическая". Предложен способ поиска сходных структур молекулярных кристаллов в кристаллографических базах данных и показана его эффективность. Найдены структуры с близкими параметрами элементарной ячейки и одинаковыми структурными мотивами. Проанализированы замены в молекулярной структуре, которые могут проходить без изменения структурного мотива. Разработано и находится в свободном доступе в сети интернет программное обеспечение, реализующее все использованные методы.
2 30 июня 2023 г.-30 июня 2024 г. Cовременные методы кластеризации и визуализации для анализа баз данных кристаллических структур II
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".