一元线性回归模型很简单
y1=ax b ε,y1为实际值,ε为正态的误差。
y2=ax b,y2为预测值。
ε=y1-y2。
代码语言:javascript复制def model(a,b,x):
# x is vector,a and b are the common number.
return a*x b
这里将整组数据的预测结果方差作为损失函数。
J(a,b)=sum((y1-y2)^2)/n
代码语言:javascript复制def cost(a,b,x,y):
# x is argu, y is actual result.
n=len(x)
return np.square(y-a*x-b).sum()/n
优化函数则进行使损失函数,即方差最小的方向进行搜索
a=a-theta*(∂J/∂a)
b=b-theta*(∂J/∂b)
这里的解释就是,对影响因素a或b求损失函数J的偏导,如果损失函数随着a或b增大而增大,我们就需要反方向搜索,使得损失函数变小。
对于偏导的求取则看的别人的推导公式
theta为搜索步长,影响速度和精度(我猜的,实际没有验证)
代码语言:javascript复制def optimize(a,b,x,y):
theta = 1e-1 # settle the step as 0.1
n=len(x)
y_hat = model(a,b,x)
# compute forecast values
da = ((y_hat-y)*x).sum()/n
db = (y_hat-y).sum()/n
a = a - theta*da
b = b - theta*db
return a, b
使用sklearn库,可以使用现成的线性回归模型
代码语言:javascript复制import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
x = [1,2,4,5,6,6,7,9]
x = np.reshape(x,newshape=(8,1))
y = [10,9,9,9,7,5,3,1]
y = np.reshape(y,newshape=(8,1))
# create an instance of LinearRegression model
lr = LinearRegression()
# train model
lr.fit(x,y)
lr.score(x,y)
# compute y_hat
y_hat = lr.predict(x)
# show the result
plt.scatter(x,y)
plt.plot(x, y_hat)
plt.show()