我是靠谱客的博主 心灵美灰狼,这篇文章主要介绍特征既有类型(nominal)变量又有数据/数字(ratio)变量的时候,该怎么进行特征处理呢?不妨试试sklearn的DictVectorizerReference,现在分享给大家,希望可以做个参考。
直接上代码,然后就着代码分析
复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19>>> from sklearn.feature_extraction import DictVectorizer >>> v = DictVectorizer(sparse=False) >>> D = [{'性别': '男', '年龄': 2}, {'性别': '女', '年龄': 23}] >>> X = v.fit_transform(D) >>> X array([[ 2., 0., 1.], [23., 1., 0.]]) >>> v.inverse_transform(X) == [{'年龄': 2.0, '性别=男': 1.0}, ... {'年龄': 23.0, '性别=女': 1.0}] >>> v.transform({'性别': '男', '年龄': 267}) array([[267., 0., 1.]])
代码中的D是字典类型的特征数据,sparse=False
表示输出的不是稀疏矩阵。
Reference
- sklearn.feature_extraction.DictVectorizer
最后
以上就是心灵美灰狼最近收集整理的关于特征既有类型(nominal)变量又有数据/数字(ratio)变量的时候,该怎么进行特征处理呢?不妨试试sklearn的DictVectorizerReference的全部内容,更多相关特征既有类型(nominal)变量又有数据/数字(ratio)变量内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复