可以进入的网站,怎么查询网站域名,互联网域名注册,wdcp 网站打不开orange3 是一个非常适合初学者的data mining library. 它让使用者通过拖拽内置的组件来形成工作流。让你不需要写任何代码就可以体验到数据挖掘和可视化的魅力。
它的桌面如下#xff0c;这里我创建了 3 个节点#xff0c;分别是数据集、小提琴图#xff0c;散点图
其中 …orange3 是一个非常适合初学者的data mining library. 它让使用者通过拖拽内置的组件来形成工作流。让你不需要写任何代码就可以体验到数据挖掘和可视化的魅力。
它的桌面如下这里我创建了 3 个节点分别是数据集、小提琴图散点图
其中 Datasets 是从 左边的 Data 组件库中拖拽过来的Datasets 是 orange3 内置的数据集比如非常常用的iris鸢尾花 数据集。双击桌面上的 Datasets 就能选择不同的数据集来作为下一步的数据来源。 点击左下角的预览按钮可以像 excel 一样预览这个数据集
可视化
先看一下散点图 x 轴选择了 sepal(花萼长度) y轴是 花的类别可以看出相关性并不是很强有很大一段x 轴的区域三种类别都有可能。 我们换一个 x 轴选择 petal length (花瓣长度)发现相关性很大基本上很容易区分开
小提琴图
小提琴图主要表现的是某个特征的分布情况。下图表现了三种花的 petal length 分布可以看出蓝色的 Iris-setosa 分布的比较集中而且与其他的类别没有重叠。 这意味着当你看看到一株 petal length(花瓣长度) 小于2.5的时候几乎可以断定它属于setosa属 有趣的是至于花萼(sepal)的宽度setosa属比起其它属看起来却趋向于长尾分布小提琴更窄说明它的分布范围随机性更大。 再看一个热力图 可以看出三种花(x轴的三个颜色) 中y 轴是四个属性 Iris-setosa 的petal length 这个属性明显和其它两种有区别可以作为一个直观的区分属性。