Введение

Полиномиальная регрессия — это тип регрессионного анализа, в котором взаимосвязь между независимой переменной x и зависимой переменной y моделируется как полиномиальная.

Математика полиномиальной регрессии относительно проста. Зависимая переменная моделируется как полиномиальная функция независимой переменной.

Основная причина использования полиномиальной регрессии — возможность моделировать нелинейные отношения. Нелинейные отношения нельзя смоделировать с помощью линейной регрессии.

Полиномиальную регрессию следует использовать, когда зависимая переменная является функцией независимой переменной.

В этой статье вы узнаете, как реализовать полиномиальную регрессию в Python.

2. Математика полиномиальной регрессии

Перед внедрением полиномиальной регрессии важно понять математику, лежащую в основе этого типа регрессии.

На самом простом уровне полиномиальная регрессия — это просто линейная регрессия с полиномиальным преобразованием независимой переменной. Это можно записать как y = wmXm + wm-1Xm-1 + … + w2X2 + w1X1 + w0, где X — независимая переменная, y — зависимая переменная, а w0, w1, w2,…wm — коэффициенты регрессии.

Чтобы определить эти коэффициенты регрессии, мы можем использовать метод наименьших квадратов. В этом методе коэффициенты регрессии выбираются таким образом, чтобы сумма квадратов остатков была минимальной.

3. Зачем использовать полиномиальную регрессию?

Полиномиальная регрессия полезна, когда отношения между независимыми и зависимыми переменными нелинейны. Это связано с тем, что линейная регрессия может моделировать только линейные отношения, а полиномиальная регрессия может моделировать нелинейные отношения.

Например, если связь между независимыми и зависимыми переменными является квадратичной или более высокого порядка, то для моделирования этой связи можно использовать полиномиальную регрессию.

Кроме того, полиномиальную регрессию также можно использовать для сопоставления сложных наборов данных, например, с большим количеством выбросов или высокой степенью изменчивости.

4. Когда использовать полиномиальную регрессию?

Полиномиальную регрессию следует использовать, когда зависимая переменная является функцией независимой переменной. Это может быть линейный, квадратичный полином или полином более высокого порядка.

Кроме того, полиномиальную регрессию следует использовать, когда данные содержат нелинейные отношения. Это связано с тем, что линейная регрессия не может моделировать нелинейные отношения.

Наконец, полиномиальная регрессия полезна для подгонки сложных наборов данных, например, с большим количеством выбросов или высокой степенью изменчивости.

5. Как реализовать полиномиальную регрессию в Python

Python упрощает реализацию полиномиальной регрессии. Все, что нам нужно сделать, это импортировать необходимые библиотеки, определить коэффициенты регрессии и подогнать модель.

Давайте рассмотрим простой пример полиномиальной регрессии. В этом примере мы будем использовать библиотеку NumPy для создания простого набора данных, а затем подогнать полином второго порядка.

Во-первых, нам нужно импортировать необходимые библиотеки:

импортировать numpy как np
импортировать matplotlib.pyplot как plt
из sklearn.linear_model импортировать LinearRegression

Далее нам нужно определить данные. Мы можем сделать это с помощью следующего кода:

x = np.array([0,1,2,3,4,5])
y = np.array([0,1,4,9,16,25])

Теперь мы можем подобрать модель линейной регрессии. Это можно сделать с помощью следующего кода:

model = LinearRegression().fit(x, y)
предсказания = model.predict(x)

Наконец, мы можем подобрать модель полиномиальной регрессии, используя следующий код:

model2 = LinearRegression().fit(np.vander(x, 2), y)
предсказания2 = model2.predict(np.vander(x, 2))

Приведенный выше код будет соответствовать полиному второго порядка к данным. Затем мы можем построить результаты, чтобы увидеть, насколько хорошо модель соответствует данным:

plt.scatter(x,y)
plt.plot(x, предсказания, цвет='красный')
plt.plot(x, предсказания2, цвет='зеленый')
plt. показывать()

6. Заключение

В этой статье мы обсудили основы полиномиальной регрессии и способы ее реализации в Python. Мы рассмотрели математику полиномиальной регрессии и причины ее использования.

Мы также обсудили, когда и как использовать полиномиальную регрессию. Это включает в себя понимание того, когда зависимая переменная является функцией независимой переменной, и понимание того, как реализовать полиномиальную регрессию в Python.

Наконец, мы рассмотрели простой пример полиномиальной регрессии с использованием библиотеки NumPy и библиотеки Scikit-learn.

В целом полиномиальная регрессия является мощным инструментом для моделирования нелинейных отношений и подбора сложных наборов данных.