Применение дискриминантного анализа с помощью регрессии на латентные структуры для установления факта отсутствия соединения в базе данных масс-спектров электронной ионизации

T14N2

Ксения Михайловна Сотнезова, Андрей Сергеевич Самохин,
Игорь Александрович Ревельский

Работа посвящена разработке математической модели, позволяющей предсказать отсутствие идентифицируемого соединения в используемой базе данных масс-спектров электронной ионизации. Математическую модель (построенную методом дискриминантного анализа с помощью регрессии на латентные структуры) можно представить в виде «черного ящика», на выходе которого формируется ответ – отсутствует ли соединение в базе данных. В качестве «входных параметров» рассмотрены степени совпадения 10 соединений, возглавляющих список кандидатов. В процессе построения, оптимизации и проверки модели было рассмотрено более 5000 объектов (масс-спектров). Разработанная классификационная модель позволила правильно предсказать отсутствие соединения в базе данных в 28.4% случаев (при этом только 1.2% соединений, в действительности присутствующих в базе данных, были неверно классифицированы как отсутствующие).

Назад к содержанию