天津网站建设平台,短链接在线工具,开发软件怎么开发,全球搜官网One-Hot 编码#xff0c;又称一位有效编码#xff0c;其方法是使用N位状态寄存器来对N个状态进行编码#xff0c;每个状态都由他独立的寄存器位#xff0c;并且在任意时候#xff0c;其中只有一位有效。
例如#xff1a; 自然状态码为#xff1a;000,001,010,011,100,1…One-Hot 编码又称一位有效编码其方法是使用N位状态寄存器来对N个状态进行编码每个状态都由他独立的寄存器位并且在任意时候其中只有一位有效。
例如 自然状态码为000,001,010,011,100,101 独热编码为000001,000010,000100,001000,010000,100000 可以这样理解对于每一个特征如果它有m个可能值那么经过独热编码后就变成了m个二元特征。并且这些特征互斥每次只有一个激活。因此数据会变成稀疏的。
这样做的好处主要有 解决了分类器不好处理属性数据的问题 在一定程度上也起到了扩充特征的作用
举例 from sklearn import preprocessing enc preprocessing.OneHotEncoder() enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]]) enc.transform([[0, 1, 3]]).toarray() 输出结果 array([[ 1., 0., 0., 1., 0., 0., 0., 0., 1.]])