stochasticLogisticRegression
stochasticLogisticRegression
Добавлено в версии: v20.1.0
Функция реализует стохастическую логистическую регрессию.
Может использоваться для задач бинарной классификации, поддерживает те же пользовательские параметры, что и stochasticLinearRegression, и работает аналогично.
Использование
Функция используется в два шага:
- Обучение модели
Для подбора параметров можно использовать такой запрос:
Здесь также необходимо вставить данные в таблицу train_data.
Количество параметров не является фиксированным и зависит только от количества аргументов, переданных в logisticRegressionState.
Все они должны быть числовыми значениями.
Обратите внимание, что столбец с целевым значением (которое требуется научиться предсказывать) вставляется первым аргументом.
Прогнозируемые метки должны находиться в диапазоне [-1, 1].
- Прогнозирование
Используя сохраненное состояние, можно предсказать вероятность того, что объект имеет метку 1.
Запрос вернёт столбец с вероятностями.
Обратите внимание, что первый аргумент evalMLMethod — это объект AggregateFunctionState, а следующие — столбцы признаков.
Также можно задать границу вероятности, которая определяет принадлежность элементов к различным меткам.
Тогда результатом будут метки.
test_data — таблица, аналогичная train_data, но может не содержать целевого значения.
Синтаксис
Аргументы
learning_rate— Коэффициент, определяющий длину шага при выполнении шага градиентного спуска. Слишком большое значениеlearning_rateможет привести к бесконечным значениям весов модели. Значение по умолчанию —0.00001.Float64l2_regularization_coef— коэффициент L2-регуляризации, который помогает предотвратить переобучение. По умолчанию —0.1.Float64mini_batch_size— задаёт количество элементов, по которым будут вычисляться и суммироваться градиенты при выполнении одного шага градиентного спуска. Чистый стохастический спуск использует один элемент, однако использование небольших батчей (порядка 10 элементов) делает шаги градиентного спуска более стабильными. Значение по умолчанию —15.UInt64method— метод обновления весов:Adam(по умолчанию),SGD,Momentum,Nesterov.MomentumиNesterovтребуют несколько больше вычислений и памяти, при этом они оказываются полезными с точки зрения скорости сходимости и устойчивости стохастических градиентных методов.Stringtarget— целевые метки бинарной классификации. Должны находиться в диапазоне [-1, 1].Floatx1, x2, ...— значения признаков (независимые переменные). Все должны быть числовыми.Float
Возвращаемое значение
Возвращает веса обученной модели логистической регрессии. Для получения предсказаний используйте evalMLMethod, которая возвращает вероятности того, что объект имеет метку 1. Array(Float64)
Примеры
Обучение модели
Создание прогнозов
Классификация с порогом
См. также