1. Python版本的问题 sklearn包的neighbors函数
我在学习时也遇到了同样的问题,我是这样解决的clf.fit(list(xy_normalized), labels)
主要原因是Python2和Python3中对zip函数做了一些修改,Python2中的zip函数返回的是一个list,而Python3的zip函数返回的是一个对象。
我目前也在学习Python+ML,大家可以共同学习,共同探讨。
2. sklearn kmeans 距离计算怎么修改
# -*- coding: utf-8 -*-
from sklearn.cluster import KMeans
from sklearn.externals import joblib
import numpy
final = open('c:/test/final.dat' , 'r')
data = [line.strip().split('\t') for line in final]
feature = [[float(x) for x in row[3:]] for row in data]
#调用kmeans类
clf = KMeans(n_clusters=9)
s = clf.fit(feature)
print s
#9个中心
print clf.cluster_centers_
#每个样本所属的簇
print clf.labels_
#用来评估簇的个数是否合适,距离越小说明簇分的越好,选取临界点的簇个数
print clf.inertia_
#进行预测
print clf.predict(feature)
#保存模型
joblib.dump(clf , 'c:/km.pkl')
#载入保存的模型
clf = joblib.load('c:/km.pkl')
'''
#用来评估簇的个数是否合适,距离越小说明簇分的越好,选取临界点的簇个数
for i in range(5,30,1):
clf = KMeans(n_clusters=i)
s = clf.fit(feature)
print i , clf.inertia_
'''
3. sklearn 分类器怎么输出 分类概率
可以使用机器学习,使用很方便(相当于别人早已经把具体过程做好了,像公式、模板一样自己代入数据就可以得到结果) from sklearn.linear_model import LogisticRegression
4. sklearn.svm在建立好模型后怎么使用
from sklearn import externals
externals.joblib.dump(clf,'文件名') #clf是fit好的模型,文件名是保存在本地的文件
clf=externals.joblib.load(‘文件名’) #这样就又把本地的模型载入,可以使用了
5. 如何解释sklearn的决策树
1首先需要安装Cython,网上下载后进行本地安装pythonsetup.pyinstall2下载Sklearn包,进行本地安装(使用pip或easy_install总是出错,如cannotimportmurmurhash3_32,最终本地安装成功)3安装后可用nosetests-vsklearn来进行测试
6. 使用python+sklearn的决策树方法预测是否有信用风险
决策树学习可能创建一个过于复杂的树,并不能很好的预测数据。也就是过拟合。
修剪机制(现在不支持),设置一个叶子节点需要的最小样本数量,或者数的最大深度,可以避免过拟合。
7. sklearn中用什么表示均方根误差
the person I love. This commitment
8. sklearn中的lr 特征取多少
跟版本没关系函数需要传参类型致明显已经说需要 字符串 数字类型参数 字符串 数字类型 zip包