Related Communities:

Классификация затменных двойных звезд

rus eng

Классификация затменных двойных звезд на основе Ensembled Weka в системе АстроГрид

Краткое описание:

Методы извлечения знаний из данных (Data Mining) применяются в различных областях науки, в том числе в астрономии, как средства, помогающие получать новые знания, делать научные открытия. В данной работе обсуждается важность встраивания в состав виртуальных обсерваторий средств для решения астрономических задач методами Data Mining, рассматриваются существующие подходы, отдается предпочтение использованию ансамблей алгоритмов и предлагается соответствующая архитектура (Ensembled Weka) встраивания системы Weka в инфраструктуру виртуальной обсерватории.

Затменно-переменные звезды – это системы двойных звезд, плоскость вращения которых образует малый угол с направлением на Землю. Такие звезды при вращении затмевают друг друга, что приводит к периодическому изменению их общей светимости. Часто компоненты такой звездной системы не могут наблюдаться независимо друг от друга, поэтому их изучение базируется на анализе изменения светимости.
Существует несколько каталогов затменно-переменных звезд, например: General Catalogue of Variable Stars (GCVS); A Finding List for Observers of Interacting Binary Systems, 5th Edition; Eclipsing variables in microlensing surveys. Данные из этих каталогов были собраны О.Ю.Малковым в один каталог, в котором сейчас есть информация о 6675 звездах. Из них определен класс у 1161 звезды.

В общем случае после получения входных данных один или несколько раз выполняется следующая процедура: данные, подготовленные в соответствии с описанием задачи, передаются требуемым алгоритмам. Результаты работы алгоритмов передаются требуемой функции обобщения.
Результатом работы ансамбля является новая таблица, уже содержащая тот или иной результат в зависимости от типа задачи. Схема работы Ensembled Weka представлена выше.

Приложения АстроГрида, используемые для решения задачи классификации затменных двойных звезд:

  • FormatConverter (ivo://ipi.ac.ru/formatConvert)
  • Данное приложение преобразует таблицы между различными форматами. Для решения данной задачи, используется пробразование из формата ARFF (представления таблиц естественного для WEKA) в формат VOTable (стандарт ВО)
  • Weka Classifier (ivo://ipi.ac.ru/dmWekaEnsembleClassifier)
  • Данное приложение производит классификацию данных, переданных во входной таблице. Помимо таблицы, приложению передается конфигурационный файл, в котором описаны структура классов, необходимые для решения задачи лгоритмы, и другие необходимые параметры.
Пример конфигурационного файла, используемого при решении задачи классификации затменных двойных звезд представлен здесь

Результаты:

В результате работы ансамбля было отклассифицировано 5514 звёзд, распределившихся по классам следующим образом: C - 852 CB - 89 CBF - 74 CBV - 149 CE - 15 CG - 1 CW - 84 CWA - 427 CWW - 331 S - 547 S2C - 3 SA - 1902 SC - 1 SH - 13 D - 553 DG - 41 DM - 422 DR – 10 В качестве порогового значения индекса уверенности было выбрано 7, и звёзды, отклассифицированные с индексом уверенности, меньшим 7, получили неполную классификацию.

Related Publications

Supported by Synthesis Group