Термину регрессионная модель, используемому в регрессионном анализе, можно сопоставить синонимы: «теория», «гипотеза». Эти термины пришли из статистики, в частности из раздела «проверка статистических гипотез». Регрессионная модель есть прежде всего гипотеза, которая должна быть подвергнута статистической проверке, после чего она принимается или отвергается.
Регрессионная модель объединяет широкий класс универсальных функций, которые описывают некоторую закономерность. При этом для построения модели в основном используются измеряемые данные, а не знание свойств исследуемой закономерности. Такая модель часто неинтерпретируема, но более точна. Это объясняется либо большим числом моделей-претендентов, которые используются для построения оптимальной модели, либо большой сложностью модели. Нахождение параметров регрессионной модели называется обучением модели.
Недостатки регрессионного анализа: модели, имеющие слишком малую сложность, могут оказаться неточными, а модели, имеющие избыточную сложность, могут оказаться переобученными.
Примеры регрессионных моделей: линейные функции, алгебраические полиномы, ряды Чебышёва, нейронные сети без обратной связи, например, однослойный персептрон Розенблатта, радиальные базисные функции и прочее.
В качестве примера представлены два варианта регрессионных моделей экологической ниши желтогорлой мыши (Apodemus flavicollis Melchior, 1834), построенные на основании данных, собранных автором на трансекте, проложенной через различные варианты ельников Центрально-Лесного заповедника.
Учет численности животных осуществлялся на площадках трансекты с постоянным шагом в 20 метров. На каждой учетной площадке фиксировалась численность видов и различные параметры среды.
Модели экологической ниши строились на основании значений осей факторов-координат экологического пространства, которые были получены путем преобразования матрицы коэффициентов гамма-корреляций между различными видами, отмеченными на трансекте. Преобразование выполнялось при помощи процедуры многомерного непараметрического шкалирования. Преимущество такого метода построения моделей в том, что происходит значительная редукция переменных среды без существенной потери информации, в результате чего исследователь имеет дело всего лишь с несколькими ключевыми переменными (факторами) вместо десятков характеристик. Полученные значения осей отражают изменение численности видов в пространстве абстрактных факторов, представленных через восприятие этих факторов самими видами . Физический смысл абстрактных факторов определялся при помощи корреляционного анализа. Всего было выделено четыре координаты экологического пространства.
1)Линейная модель пошаговой множественной регрессии, построенная на основе четырех выделенных факторов, объясняет 61,4 % варьирования численности желтогорлой мыши
2)В другую модель, построенную при помощи итерационных методов нелинейной регрессии, реализуемого в модуле «Нелинейное оценивание» в программе STATISTICA, были введены дополнительные элементы. Это повысило предсказательную силу модели до 79,7 %, что очень существенно, особенно если речь идет о природных условиях.
Вторая регрессионная модель, содержащая нелинейные элементы, предсказывает размещение и вероятную численность желтогорлой мыши, значительно лучше первой, которая учитывает лишь самую общую зависимость. Желтогорлая мышь имеет квадратическую зависимость от фактора 4, что указывает на очень высокую чувствительность к изменениям соответствующих параметров среды. Кроме того, вид зависим от совокупного действия второго и четвертого факторов.
В целом, вторая математическая модель, содержащая нелинейные элементы, позволяет получить дополнительную информацию об особенностях размещения вида при минимуме ошибок.
Таким образом, применение нелинейных регрессионных моделей позволяет учесть более тонкие механизмы пространственного размещения организмов и улучшать качество моделирования путем выявления скрытых зависимостей и неаддитивного действия переменных.
Поможем написать любую работу на аналогичную тему