当前位置 博文首页 > 清风紫雪:机器学习7-模型保存&无监督学习
def linear3(): """ 岭回归的优化方法对波士顿房价预测 """ #获取数据 boston=load_boston() #划分数据集 x_train,x_test,y_train,y_test=train_test_split(boston.data,boston.target,random_state=22) #标准化 transfer=StandardScaler() x_train=transfer.fit_transform(x_train) x_test=transfer.transform(x_test) #预估器 # estimator=Ridge(alpha=0.0001, max_iter=100000) # estimator.fit(x_train,y_train) #保存模型 # joblib.dump(estimator,"my_ridge.pkl") #加载模型 estimator=joblib.load("my_ridge.pkl") #得出模型 print("岭回归-权重系数为:\n",estimator.coef_) print("岭回归-偏置为:\n",estimator.intercept_ ) #模型评估 y_predict = estimator.predict(x_test) print("预测房价:\n", y_predict) error = mean_squared_error(y_test, y_predict) print("岭回归-均方差误差:\n", error) return None if __name__ == '__main__': # linear1() # linear2() linear3()
保存:保存训练完结束的模型
加载:加载已有的模型,去进行预测结果和之前的模型一样
我们先来看一下一个K-means的聚类效果图
我们以一张图来解释效果
如何评估聚类的效果?
分析过程(我们以一个蓝1点为例)
1、计算出蓝1离本身族群所有点的距离的平均值a_i
2、蓝1到其它两个族群的距离计算出平均值红平均,绿平均,取最小的那个距离作为b_i
如果b_i>>a_i:趋近于1效果越好, b_i<<a_i:趋近于-1,效果不好。轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优。