Патент
Действует
Изобретение № 2672394

СПОСОБЫ И СИСТЕМЫ ДЛЯ ОЦЕНКИ ОБУЧАЮЩИХ ОБЪЕКТОВ ПОСРЕДСТВОМ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ

Правообладатель: ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЯНДЕКС" (RU) Авторы: Бурангулов Павел Александрович (RU)
Формула изобретения

1. Реализованный посредством компьютера способ обучения для алгоритма машинного обучения (MLA), выполняемый сервером и включающий в себя следующие действия:

получают посредством алгоритма MLA первый набор обучающих образцов, содержащий множество признаков;

итеративно обучают посредством алгоритма MLA первую прогнозирующую модель на основе, по меньшей мере, части из множества признаков, при этом обучение на каждой первой обучающей итерации включает в себя формирование соответствующего первого показателя ошибки прогнозирования, по меньшей мере, частично указывающего на связанную с первой прогнозирующей моделью ошибку прогнозирования на соответствующей первой обучающей итерации;

анализируют посредством алгоритма MLA соответствующий первый показатель ошибки прогнозирования на каждой первой обучающей итерации для определения точки «сверхподгонки», соответствующей данной первой обучающей итерации, после которой тенденция для первого показателя ошибки прогнозирования изменяется с общего уменьшения на общее увеличение;

определяют посредством алгоритма MLA по меньшей мере одну начальную точку оценивания, расположенную за несколько итераций до точки «сверхподгонки»;

получают посредством алгоритма MLA данные нового набора обучающих объектов;

итеративно переобучают посредством алгоритма MLA первую прогнозирующую модель, находящуюся в соответствующем обученном состоянии, связанном с указанной по меньшей мере одной начальной точкой оценивания, с использованием по меньшей мере одного обучающего объекта из нового набора обучающих объектов для получения множества переобученных первых прогнозирующих моделей;

формируют соответствующий показатель ошибки прогнозирования для каждой модели из множества переобученных первых прогнозирующих моделей после переобучения на по меньшей мере одной итерации переобучения, соответствующей по меньшей мере одной первой обучающей итерации, причем соответствующий показатель ошибки прогнозирования после переобучения, по меньшей мере, частично указывает на ошибку прогнозирования, связанную с переобученной первой прогнозирующей моделью;

выбирают посредством алгоритма MLA один из первых наборов обучающих образцов и по меньшей мере один обучающий объект из нового набора обучающих объектов на основе множества показателей ошибки прогнозирования после переобучения, связанных с множеством переобученных первых прогнозирующих моделей, и на основе множества соответствующих первых показателей ошибки прогнозирования.

2. Способ по п. 1, отличающийся тем, что новый набор обучающих объектов представляет собой новый набор признаков или новый набор обучающих образцов.

3. Способ по п. 2, отличающийся тем, что обучение и переобучение первой прогнозирующей модели осуществляют с применением метода градиентного бустинга.

4. Способ по п. 3, отличающийся тем, что выбор посредством алгоритма MLA по меньшей мере одного обучающего объекта из нового набора обучающих объектов включает в себя сравнение множества показателей ошибки прогнозирования после переобучения с множеством соответствующих первых показателей ошибки прогнозирования посредством проверки статистической гипотезы.

5. Способ по п. 4, отличающийся тем, что первый показатель ошибки прогнозирования и соответствующий показатель ошибки прогнозирования переобученной первой прогнозирующей модели представляют собой среднеквадратическую ошибку (MSE) или среднюю абсолютную ошибку (МАЕ).

6. Способ по п. 5, отличающийся тем, что проверку статистической гипотезы выполняют с использованием критерия знаковых рангов Уилкоксона.

7. Способ по п. 6, отличающийся тем, что указанная по меньшей мере одна начальная точка оценивания представляет собой множество начальных точек оценивания.

8. Способ по п. 7, отличающийся тем, что каждая из множества начальных точек оценивания связана с соответствующим множеством переобученных первых прогнозирующих моделей.

9. Система обучения для алгоритма машинного обучения (MLA), содержащая:

процессор;

машиночитаемый физический носитель информации, содержащий команды, причем процессор выполнен с возможностью при выполнении команд осуществлять следующие действия:

получение посредством алгоритма MLA первого набора обучающих образцов, содержащего множество признаков;

итеративное обучение посредством алгоритма MLA первой прогнозирующей модели на основе, по меньшей мере, части из множества признаков, при этом обучение на каждой первой обучающей итерации включает в себя формирование соответствующего первого показателя ошибки прогнозирования, по меньшей мере, частично указывающего на связанную с первой прогнозирующей моделью ошибку прогнозирования на соответствующей первой обучающей итерации;

анализ посредством алгоритма MLA соответствующего первого показателя ошибки прогнозирования на каждой первой обучающей итерации для определения точки «сверхподгонки», соответствующей данной первой обучающей итерации, после которой тенденция для первого показателя ошибки прогнозирования изменяется с общего уменьшения на общее увеличение;

определение посредством алгоритма MLA по меньшей мере одной начальной точки оценивания, расположенной за несколько итераций до точки «сверхподгонки»;

получение посредством алгоритма MLA данных нового набора обучающих объектов;

итеративное переобучение посредством алгоритма MLA первой прогнозирующей модели, находящейся в соответствующем обученном состоянии, связанном с по меньшей мере одной начальной точкой оценивания, с использованием по меньшей мере одного обучающего объекта из нового набора обучающих объектов, для получения множества переобученных первых прогнозирующих моделей;

формирование соответствующего показателя ошибки прогнозирования для каждой модели из множества переобученных первых прогнозирующих моделей после переобучения на по меньшей мере одной итерации переобучения, соответствующей по меньшей мере одной первой обучающей итерации, причем соответствующий показатель ошибки прогнозирования после переобучения, по меньшей мере, частично указывает на ошибку прогнозирования, связанную с переобученной первой прогнозирующей моделью;

выбор посредством алгоритма MLA одного из первых наборов обучающих образцов и по меньшей мере одного обучающего объекта из нового набора обучающих объектов на основе множества показателей ошибки прогнозирования после переобучения, связанных с множеством переобученных первых прогнозирующих моделей, и на основе множества соответствующих первых показателей ошибки прогнозирования.

10. Система по п. 9, отличающаяся тем, что новый набор обучающих объектов представляет собой новый набор признаков или новый набор обучающих образцов.

11. Система по п. 10, отличающаяся тем, что процессор выполнен с возможностью применения метода градиентного бустинга для обучения и переобучения первой прогнозирующей модели.

12. Система по п. 11, отличающаяся тем, что процессор выполнен с возможностью сравнения множества показателей ошибки прогнозирования после переобучения с множеством соответствующих первых показателей ошибки прогнозирования посредством проверки статистической гипотезы с целью выбора посредством алгоритма MLA по меньшей мере одного обучающего объекта из нового набора обучающих объектов.

13. Система по п. 12, отличающаяся тем, что первый показатель ошибки прогнозирования и соответствующий показатель ошибки прогнозирования после переобучения представляют собой среднеквадратическую ошибку (MSE) или среднюю абсолютную ошибку (МАЕ).

14. Система по п. 13, отличающаяся тем, что проверка статистической гипотезы проводится с использованием критерия знаковых рангов Уилкоксона.

15. Система по п. 14, отличающаяся тем, что по меньшей мере одна начальная точка оценивания представляет собой множество начальных точек оценивания.

16. Система по п. 15, отличающаяся тем, что каждая из множества начальных точек оценивания связана с соответствующим множеством переобученных первых прогнозирующих моделей.

показать больше
Спасибо! Мы перезвоним вам в ближайшее время!