当前位置: 首页 > news >正文

河北省建设集团有限公司网站丽水专业网站建设公司

河北省建设集团有限公司网站,丽水专业网站建设公司,网站怎么做翻页,网站地图定位用什么技术做文章目录一、散点图1. scatter() 函数2. 设置图标大小3. 自定义点的颜色和透明度4. 可以选择不同的颜色条#xff0c;配合 cmap 参数5. cmap 的分类5.1 Sequential colormaps#xff1a;连续化色图5.2 Diverging colormaps#xff1a;两端发散的色图 .5.3 Qualitative color… 文章目录一、散点图1. scatter() 函数2. 设置图标大小3. 自定义点的颜色和透明度4. 可以选择不同的颜色条配合 cmap 参数5. cmap 的分类5.1 Sequential colormaps连续化色图5.2 Diverging colormaps两端发散的色图 .5.3 Qualitative colormaps离散化色图5.4 Miscellaneous colormaps其它色图二、保存图片 pyplot.savefig()三、箱线图绘制 boxplot()1. 箱线图基本介绍2. 函数的使用 pyplot.boxplot()四、词云图1. WordCloud 参数查看2. 中文使用词云图需要使用 jieba 分词模块3. jieba.analyse的使用提取关键字在最开始先引入我们的 numpy 和 matplotlib 库。 from matplotlib import pyplot as plt import numpy as np同时对基本配置进行设置将中文字体设置为黑体不包含中文负号分辨率为 100图像显示大小设置为 (5,3)。 plt.rcParams[font.sans-serif] [SimHei] plt.rcParams[axes.unicode_minus] False plt.rcParams[figure.dpi] 100 plt.rcParams[figure.figsize] (5,3)一、散点图 散点图也叫 X-Y 图它将所有的数据以点的形式展现在直角坐标系上以显示变量之间的相互影响程度点的位置由变量的数值决定。通过观察散点图上数据点的分布情况我们可以推断出变量间的相关性。如果变量之间不存在相互 关系那么在散点图上就会表现为随机分布的离散的点如果存在某种相关性那么大部分的数据 点就会相对密集并以某种趋势呈现。数据的相关关系主要分为正相关两个变量值同时增长、负相关一个变量值增加另一个变量值下降、 不相关、线性相关、指数相关等表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。 1. scatter() 函数 scatter() 函数的语法模板如下 matplotlib.pyplot.scatter(x, y, sNone, cNone, markerNone, cmapNone, normNone, vminNone, vmaxNone, alphaNone, linewidthsNone, edgecolorsNone, plotnonfiniteFalse, dataNone, *kwargs)其参数含义如下x, y 表示散点的坐标。s 表示散点的面积。c 表示散点的颜色默认值为蓝色‘b’其余颜色同 plt.plot( )。marker 表示散点样式默认值为实心圆‘o’其余样式同 plt.plot( )。alpha 表示散点透明度[0, 1] 之间的数0 表示完全透明1 则表示完全不透明。linewidths 表示散点的边缘线宽。edgecolors 表示散点的边缘颜色。cmap 表示 Colormap默认 None标量或者是一个 colormap 的名字只有 c 是一个浮点数数组的时才使用。scatter() 函数接收长度相同的数组参数一个用于 x 轴的值另一个用于 y 轴上的值。其中x 轴和 y 轴的数据我们直接设定并使用 plt.scatter( ) 函数进行散点图的绘制。 x np.array([1, 2, 3, 4, 5, 6, 7, 8]) y np.array([1, 4, 9, 16, 7, 11, 23, 18])​ plt.scatter(x, y)2. 设置图标大小 x 轴和 y 轴仍采用上面的数据同时生成一个 [0,1)之间的随机浮点数或N维浮点数组用以表示散点的大小。 x np.array([1, 2, 3, 4, 5, 6, 7, 8]) y np.array([1, 4, 9, 16, 7, 11, 23, 18]) print((20 * np.random.rand(8))** 2)​ s (20 * np.random.rand(8))** 2​ plt.scatter(x, y, s,alpha0.4) plt.show() #[131.25378089 364.17758417 253.68756331 172.75394022 296.36009688 # 111.50497604 161.49816335 160.3655232 ]3. 自定义点的颜色和透明度 颜色的设置方式有如下三种1 颜色英文。2 字母 r、b、g。3 十六进制 #123ab1。此时我们通过随机种子生成函数 np.random.rand() 在 x 轴和 y 轴生成一个 [0,1) 之间的随机浮点数或 N 维浮点数组取数范围为正态分布的随机样本数。其中颜色可以使用一组数字序列如只需要 3 种颜色这里我们直接使用 np.random.rand() 对颜色进行随机生成。 x np.random.rand(50) y np.random.rand(50) ​s (10 * np.random.randn(50))** 2 colors np.random.rand(50)​ plt.scatter(x, y, s,ccolors)4. 可以选择不同的颜色条配合 cmap 参数 Matplotlib 模块提供了很多可用的颜色条。颜色条就像一个颜色列表其中每种颜色都有一个范围从 0 到 100 的值。下面是一个颜色条的例子 viridis。 对于x 轴和 y 轴的数据我们通过 np.random.rand() 生成 100 个随机数据。在此要演示 cmap 参数因此我们使用 np.arange() 直接生成 [1,100] 的颜色数据。然后将 cmap 参数设置为蓝色其他颜色同理就会生成各种蓝色的散点图。 x np.random.rand(100)​ y np.random.rand(100) colors np.arange(1,101)​ plt.scatter(x, y, ccolors, cmapBlues)5. cmap 的分类 5.1 Sequential colormaps连续化色图 特点在两种色调之间近似平滑变化通常是从低饱和度例如白色到高饱和度例如明亮的蓝色。应用适用于大多数科学数据可直观地看出数据从低到高的变化。(1 以中间值颜色命名egviridis 松石绿[‘viridis’, ‘plasma’, ‘inferno’, ‘magma’, ‘cividis’]。 2 以色系名称命名由低饱和度到高饱和度过渡egYlOrRd yellow-orange-red其它同理: [‘Greys’, ‘Purples’, ‘Blues’, ‘Greens’, ‘Oranges’, ‘Reds’,‘YlOrBr’, ‘YlOrRd’, ‘OrRd’, ‘PuRd’, ‘RdPu’, ‘BuPu’,‘GnBu’, ‘PuBu’, ‘YlGnBu’, ‘PuBuGn’, ‘BuGn’, ‘YlGn’,‘binary’, ‘gist_yarg’, ‘gist_gray’, ‘gray’, ‘bone’, ‘pink’,‘spring’, ‘summer’, ‘autumn’, ‘winter’, ‘cool’, ‘Wistia’,‘hot’, ‘afmhot’, ‘gist_heat’, ‘copper’]。 5.2 Diverging colormaps两端发散的色图 . 特点具有中间值通常是浅色并在高值和低值处平滑变化为两种不同的色调。应用适用于数据的中间值很大的情况例如0因此正值和负值分别表示为颜色图的不同颜色。例如[‘PiYG’, ‘PRGn’, ‘BrBG’, ‘PuOr’, ‘RdGy’, ‘RdBu’,‘RdYlBu’, ‘RdYlGn’, ‘Spectral’, ‘coolwarm’, ‘bwr’, ‘seismic’]。 5.3 Qualitative colormaps离散化色图 特点离散的颜色组合。应用在深色背景上绘制一系列线条时可以在定性色图中选择一组离散的颜色例如color_list plt.cm.Set3(np.linspace(0, 1, 12))。 5.4 Miscellaneous colormaps其它色图 二、保存图片 pyplot.savefig() 保存图片的语法模板 pyplot.savefig() 如下 savefig(fname, dpiNone, facecolor’w’, edgecolor’w’, orientation’portrait’, papertypeNone, formatNone, transparentFalse, bbox_inchesNone, pad_inches0.1, frameonNone, metadataNone)其参数含义如下fname 表示字符串或者仿路径或仿文件如果格式已经设置这将决定输出的格式并将文件按 fname 来保存。如果格式没有设置在 fname 有扩展名的情况下推断按此保存没有扩展名将按照默认格式存储为 png 格式并将适当的扩展名添加在 fname 后面。dpi 表示分辨率每英寸的点数。facecolor颜色或 auto默认值是 auto表示图形表面颜色。如果是 auto使用当前图形的表面颜色。edgecolor颜色或 auto默认值auto表示图形边缘颜色。如果是 auto使用当前图形的边缘颜色。format字符串表示文件格式比如 pngjpgpdfsvg 等未设置的行为将被记录在 fname 中。transparent 表示用于将图片背景设置为透明。图形也会是透明除非通过关键字参数指定了表面颜色和/或边缘其中需要注意的是1 第一个参数就是保存的路径.2 如果路径中包含未创建的文件夹会报错需要手动或者使用 os 模块创建。3 必须在调用 plt.show() 之前保存,否则将保存的是空白图形.4 如果保存到指定文件夹中一定确保文件夹存在。 ​- 例如我们对 x 轴和 y 轴的数据进行指定然后使用 os 模块判断目录是否存在如果不存在的话使用 os 模块进行文件夹的创建。 import os x_axis [1, 4, 9, 16, 25, 36, 49, 64, 81, 100] y_axis [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] plt.hist(x_axis, y_axis) plt.xlabel(X) plt.ylabel(Y) if not os.path.exists(my):os.mkdir(my) plt.savefig(my/my_show.png) plt.show()三、箱线图绘制 boxplot() 箱线图Boxplot是一种用作显示一组数据分散情况资料的统计图表。 1. 箱线图基本介绍 箱线图又称箱形图boxplot或盒式图不同于一般的折线图、柱状图或饼图等图表 其包含一些统计学的均值、分位数、极值等统计量该图信息量较大不仅能够分析不同类别数据平均水平差异 还能揭示数据间离散程度、异常值、分布差异等。具体含义可通过如下图表进行说明 在箱型图中我们从上四分位数到下四分位数绘制一个盒子然后用一条垂直触须形象地称为“盒须”穿过盒子的中间。上垂线延伸至上边缘最大值下垂线延伸至下边缘最小值箱型图一般应用在如下场景1 箱型图由于能显示一组数据分散情况常用于品质管理。2 箱型图有利于数据的清洗能快速知道数据分别情况。3 箱型图有助于分析一直数据的偏向如分析公司员工收入水平。 2. 函数的使用 pyplot.boxplot() 其语法模板如下 matplotlib.pyplot.boxplot(x, notchNone, symNone, vertNone, whisNone, positionsNone, widthsNone, patch_artistNone, bootstrapNone, usermediansNone, conf_intervalsNone, meanlineNone, showmeansNone, showcapsNone, showboxNone, showfliersNone, boxpropsNone, labelsNone, flierpropsNone, medianpropsNone, meanpropsNone, cappropsNone, whiskerpropsNone, manage_ticksTrue, autorangeFalse, zorderNone, *, dataNone)x 表示输入数据。类型为数组或向量序列。是一个必备参数。notch 表示控制箱体中央是否有 V 型凹槽。当取值为 True 时箱体中央有 V 型凹槽凹槽表示中位数的置信区间取值为 False 时箱体为矩形。数据类型为布尔值默认值为 False是一个可选参数。vert 表示箱体的方向当取值为 True 时绘制垂直箱体当取值为 False 时绘制水平箱体。数据类型为布尔值默认值为 True。是一个可选参数。positions 表示指定箱体的位置。刻度和极值会自动匹配箱体位置。数据类型为类数组结构是一个可选参数。默认值为 range(1, N1) N 为箱线图的个数。widths 表示箱体的宽度。类数据型为浮点数或类数组结构。默认值为 0.5 或 0.15 * 极值间的距离。labels 表示每个数据集的标签默认值为 None。数据类型为序列是一个可选参数。autorange 表示当取值为 True 且数据分布满足上四分位数75%和下四分位数25%相等。数据类型为布尔值默认值为 False是一个可选参数。showmeans 表示是否显示算术平均值。数据类型为布尔值默认值为 False是一个可选参数。meanline 表示均值显示为线还是点当取值为 True且 showmeans、shownotches 参数均为 True 时显示为线。数据类型为布尔值默认值为 False是一个可选参数。capprops 表示箱须横杠的样式。数据类型为字典默认值为 None是一个可选参数。boxprops 表示箱体的样式。数据类型为字典默认值为 None是一个可选参数。whiskerprops 表示箱须的样式。数据类型为字典默认值为 None是一个可选参数。flierprops 表示离群点的样式。数据类型为字典默认值为 None是一个可选参数。medianprops 表示中位数的样式。数据类型为字典默认值为 None是一个可选参数。meanprops 表示算术平均值的样式。数据类型为字典默认值为 None是一个可选参数。例如我们可以生成如下的简单箱线图。使用 showmeans 和 meanline 参数。 x np.array([1,20,30,50,60]) print(np.mean(x)) plt.boxplot(x,showmeansTrue,meanlineTrue) plt.grid() plt.show() #32.2通过创建 5 行 5 列的数据使用 boxprops 和 meanprops 参数。 x np.random.randint(10,100,size(5,5)) ​box {linestyle:--,linewidth:1,color:blue} ​mean {marker:o,markerfacecolor:pink,markersize:2} ​​plt.boxplot(x,meanlineTrue,showmeansTrue,labels[A,B,C,D,E], boxpropsbox,meanpropsmean) plt.show()四、词云图 词云图也叫文字云是对文本中出现频率较高的关键词予以视觉化的展现 词云图过滤掉大量的低频低质的文本信息使得浏览者只要一眼扫过文本就可领略文本的主旨。 WordCloud 是一款 python 环境下的词云图工具包同时支持 python2 和 python3能通过代码的形式把关键词数据转换成直观且有趣的图文模式。pip 的默认安装方式pip install wordcloud。如果是使用 conda 的方式安装则使用以下命令安装conda install -c conda-forge wordcloud。 1. WordCloud 参数查看 属性数据类型|默认值解析font_pathstring字体路径 windowsC:/Windows/Fonts/ Linux: /usr/share/fontswidth int (default400)输出的画布宽度默认为400像素height int (default200)输出的画布高度默认为200像素prefer_horizontal float (default0.90)词语水平方向排版出现的频率,默认 0.9 所以词语垂直方向排版出现频率为0.1mask nd-array or None (defaultNone)如果参数为空则使用二维遮罩绘制词云 如果mask非空设置的宽高值将被忽略 遮罩形状被 mask 取代 scale float (default1)按照比例进行放大画布如设置为1.5 则长和宽都是原来画布的1.5倍min_font_size int (default4)显示的最小的字体大小font_step int (default1)字体步长如果步长大于1会加快运算 但是可能导致结果出现较大的误差max_words number (default200)要显示的词的最大个数stopwords set of strings or None设置需要屏蔽的词如果为空 则使用内置的STOPWORDSbackground_color color value default”black”背景颜色max_font_size int or None defaultNone 显示的最大的字体大小mode string (default”RGB”)当参数为“RGBA”并且background_color 不为空时背景为透明relative_scaling float (default.5)词频和字体大小的关联性color_func callable, defaultNone生成新颜色的函数如果为空 则使用 self.color_funcregexp string or None (optional) 使用正则表达式分隔输入的文本collocations bool, defaultTrue是否包括两个词的搭配colormap string or matplotlib colormap default”viridis” 给每个单词随机分配颜色 若指定color_func则忽略该方法random_state int or None为每个单词返回一个PIL颜色 2. 中文使用词云图需要使用 jieba 分词模块 他支持如下几种分词模式1 精确模式试图将句子最精确地切开适合文本分析。2 全模式把句子中所有的可以成词的词语都扫描出来, 速度非常快但是不能解决歧义。3 搜索引擎模式在精确模式的基础上对长词再次切分提高召回率适合用于搜索引擎分词。4 支持繁体分词。5 支持自定义词典。他的代码对 Python 2/3 均兼容有如下几种安装方式1 全自动安装easy_install jieba 或者 pip install jieba / pip3 install jieba。2 半自动安装先下载 http://pypi.python.org/pypi/jieba/ 解压后运行 python setup.py install。3 手动安装将 jieba 目录放置于当前目录或者 site-packages 目录通过 import jieba 来引用。知识点补充jieba.cut 方法接受三个输入参数: 需要分词的字符串cut_all 参数用来控制是否采用全模式HMM 参数用来控制是否使用 HMM 模型。jieba.cut_for_search 方法接受两个参数需要分词的字符串是否使用 HMM 模型。该方法适合用于搜索引擎构建倒排索引的分词粒度比较细 待分词的字符串可以是 unicode 或 UTF-8 字符串、GBK 字符串。注意不建议直接输入 GBK 字符串可能无法预料地错误解码成 UTF-8。jieba.cut 以及 jieba.cut_for_search 返回的结构都是一个可迭代的 generator可以使用 for 循环来获得分词后得到的每一个词语(unicode)或者用 jieba.lcut 以及 jieba.lcut_for_search 直接返回 list。 3. jieba.analyse的使用提取关键字 第一个参数 表示待提取关键词的文本。第二个参数 topK 表示返回关键词的数量重要性从高到低排序。第三个参数 withWeight 表示是否同时返回每个关键词的权重。第四个参数allowPOS() 表示词性过滤为空表示不过滤若提供则仅返回符合词性要求的关键词 查看jieba 词性表.txt。
http://www.dnsts.com.cn/news/256348.html

相关文章:

  • 怎么为做的网站配置域名高端定制app开发
  • 青海高端网站建设公司威海网站建设开发公司
  • 如何做网站权重广东网站建设报价
  • 网站怎么建设高端公司教学网站建设目的
  • 竞拍网站做烂了深圳网站设计的公司
  • 聊城网站推广品牌办公室设计公司
  • 电商导购网站怎么做网页设计欣赏怎么写
  • 网站流量做那些好个性个人网站模板
  • 淮安建设网站有没有做网站的电话
  • 网站开发合同的付款方式舟山seo网络优化招聘
  • 网站seo专员北京网站优化厂家
  • 做水果网站行公司官网怎么设计
  • 门户网站建设公司哪家好哪些网站discuz做的
  • 在线海报设计网站免费ppt模板网站下载
  • 永久免费手机网站自助建站策划案
  • 做影视网站引流钦州的网站建设
  • 网站开发详细介绍spring做网站
  • 网站30g流量佛山企业网站建设特色
  • 网站上线需要哪些步骤建筑师培训
  • 如何使用win2008iis建设网站是怎么开的?
  • 创建网站建设医院网站建设的理由
  • 遵义市建设局网站官网做软件的声称发现网站漏洞
  • 注册域名建设网站上海网站关键词
  • 罗湖商城网站建设多少钱网站如何搭建
  • 免费文档网站php网站开发最低配置
  • 深圳企业网站制作设计方案动漫设计专科学校
  • 搜搜提交网站入口拥有服务器后如何做网站
  • 怎样提高网站访问速度徐州建站服务
  • 在凡科建设网站的流程网站运营报告
  • 网站页面术语昆山专业网站建设公司