Cовременные методы кластеризации и визуализации для анализа баз данных кристаллических структурНИР

Modern clustering and visualisation techniques for crystallographic database analysis

Источник финансирования НИР

грант РНФ

Этапы НИР

# Сроки Название
1 30 июня 2022 г.-30 июня 2023 г. Cовременные методы кластеризации и визуализации для анализа баз данных кристаллических структур I
Результаты этапа: На примере 2765 координационных полиэдров девяти металлов с КЧ 5 была продемонстрирована возможность использования современных методов машинного обучения без учителя для визуализации кристаллографических данных. На использованном наборе данных метод t-SNE (t-distributed stochastic neighbor embedding, стохастические вложения соседей с распределением Стьюдента) позволял выделить различные типы координационного окружения включая тригональную бипирамиду, тетрагональную пирамиду, и 4+1 окружение с центральным атомом в центре плоского квадрата, характерное для меди II. На том же самом наборе данных ранее применявшийся линейный метод понижения размерности PCA (principal component analysis, анализ главных компонент) 5233 координационных полиэдра лантанидов состава MO8 из Кембриджской базы структурных данных проанализированы с помощью современного метода машинного обучения без учителя UMAP (Uniform Manifold Approximation and Projection). Результаты геометрического кластерного анализа сопоставлены с результатами наиболее распространённого метода анализа координационных полиэдров — непрерывного измерения формы. Показана применимость нового метода для классификации координационных окружений, включающих бидентатные лиганды с малым «углом укуса» (bite angle), анализ которых с применением известных ранее методов затруднён. По результатам анализа принята к публикации статья в журнале "Известия Академии Наук, серия химическая". Предложен способ поиска сходных структур молекулярных кристаллов в кристаллографических базах данных и показана его эффективность. Найдены структуры с близкими параметрами элементарной ячейки и одинаковыми структурными мотивами. Проанализированы замены в молекулярной структуре, которые могут проходить без изменения структурного мотива. Разработано и находится в свободном доступе в сети интернет программное обеспечение, реализующее все использованные методы.
2 30 июня 2023 г.-30 июня 2024 г. Cовременные методы кластеризации и визуализации для анализа баз данных кристаллических структур II
Результаты этапа: В ходе данной научно-исследовательской работы были получены следующие основные результаты: Разработана и реализована методика поиска изоструктурных пар молекулярных кристаллов в Кембриджской базе структурных данных (КБСД), основанная на анализе параметров элементарных ячеек и молекулярного сходства. Проведен анализ распространенности изоструктурности в молекулярных кристаллах. Установлено, что для структур с параметрами элементарных ячеек, совпадающими в пределах 5%, вероятность изоструктурности составляет от 2.5% до 5.5%. Выявлены наиболее распространенные типы структурных различий, приводящих к изоструктурности, включая замены атомов, добавление атомов и изменение кратности связей. Определены вероятности сохранения кристаллической упаковки при конкретных молекулярных заменах, например, для замены Cl/Br вероятность составляет 42%, для S/Se - 39%. Поставленные задачи решены в полном объеме. Разработанная методика позволяет эффективно идентифицировать изоструктурные пары в больших массивах кристаллографических данных. Результаты исследования могут быть использованы для прогнозирования и инженерии изоструктурных кристаллов и органических сплавов на их основе. Полученные данные о вероятностях сохранения упаковки при конкретных заменах могут служить основой для направленного дизайна новых материалов с заданными свойствами. Экономическая эффективность внедрения результатов может быть достигнута за счет сокращения времени и ресурсов на экспериментальный поиск изоструктурных соединений в области разработки новых функциональных материалов. Научно-технический уровень выполненной работы соответствует современным мировым достижениям в области кристаллохимии и инженерии кристаллов. Разработанная методика анализа больших массивов кристаллографических данных не имеет прямых аналогов и открывает новые возможности для систематического изучения закономерностей формирования кристаллических структур органических соединений.

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".