当前位置: 首页 > news >正文

怎样做一元购网站小程序免费制作平台

怎样做一元购网站,小程序免费制作平台,注册安全工程师难吗,html网站开发心得文章目录 一、实验介绍1. 算法流程2. 算法解释3. 算法特点4. 应用场景5. 注意事项 二、实验环境1. 配置虚拟环境2. 库版本介绍 三、实验内容0. 导入必要的库1. Kmeans类a. 构造函数b. 闵可夫斯基距离c. 初始化簇心d. K-means聚类e. 聚类结果可视化 2. 辅助函数3. 主函数a. 命令… 文章目录 一、实验介绍1. 算法流程2. 算法解释3. 算法特点4. 应用场景5. 注意事项 二、实验环境1. 配置虚拟环境2. 库版本介绍 三、实验内容0. 导入必要的库1. Kmeans类a. 构造函数b. 闵可夫斯基距离c. 初始化簇心d. K-means聚类e. 聚类结果可视化 2. 辅助函数3. 主函数a. 命令行界面 CLIb. 数据加载c. 模型训练及可视化 4. 运行脚本的命令5. 代码整合 原型聚类中的K均值算法是一种常用的聚类方法该算法的目标是通过迭代过程找到数据集的簇划分使得每个簇内的样本与簇内均值的平方误差最小化。这一过程通过不断迭代更新簇的均值来实现。 一、实验介绍 1. 算法流程 初始化 从样本集中随机选择k个样本作为初始均值向量。迭代过程 重复以下步骤直至均值向量不再更新 对每个样本计算与各均值向量的距离。将样本划分到距离最近的均值向量所对应的簇。更新每个簇的均值向量为该簇内样本的平均值。 输出 返回最终的簇划分。 2. 算法解释 步骤1中通过随机选择初始化k个均值向量。步骤2中通过计算样本与均值向量的距离将每个样本分配到最近的簇。然后更新每个簇的均值向量为该簇内样本的平均值。算法通过迭代更新不断优化簇内样本与均值向量的相似度最终得到较好的聚类结果。 3. 算法特点 K均值算法是一种贪心算法通过局部最优解逐步逼近全局最优解。由于需要对每个样本与均值向量的距离进行计算算法复杂度较高。对于大型数据集和高维数据K均值算法的效果可能受到影响。 4. 应用场景 K均值算法适用于样本集可以被均值向量较好表示的情况特别是当簇呈现球形或近似球形分布时效果较好。在图像分割、用户行为分析等领域广泛应用。 5. 注意事项 对于K均值算法初始均值向量的选择可能影响最终聚类结果因此有时需要多次运行算法选择最优的结果。算法对异常值敏感可能导致簇的均值向量被拉向异常值因此在处理异常值时需要谨慎。 二、实验环境 1. 配置虚拟环境 conda create -n ML python3.9conda activate MLconda install scikit-learn matplotlib seaborn2. 库版本介绍 软件包本实验版本matplotlib3.5.2numpy1.21.5python3.9.13scikit-learn1.0.2seaborn0.11.2 三、实验内容 0. 导入必要的库 import numpy as np import random import seaborn as sns import matplotlib.pyplot as plt import argparse1. Kmeans类 __init__ 初始化K均值聚类的参数包括聚类数目 k、数据 data、初始化模式 mode默认为 “random”、最大迭代次数 max_iters、闵可夫斯基距离的阶数 p、随机种子 seed等。minkowski_distance 函数计算两个样本点之间的闵可夫斯基距离。center_init 函数根据指定的模式初始化聚类中心。fit 方法执行K均值聚类的迭代过程包括分配样本到最近的簇、更新簇中心直到满足停止条件。visualization 函数使用Seaborn和Matplotlib可视化聚类结果。 a. 构造函数 class Kmeans(object):def __init__(self, k, data: np.ndarray, moderandom, max_iters0, p2, seed0):self.k kself.data dataself.mode modeself.max_iter max_iters if max_iters 0 else int(1e8)self.p pself.seed seedself.centers Noneself.clu_idx np.zeros(len(self.data), dtypenp.int32) # 样本的分类簇self.clu_dist np.zeros(len(self.data), dtypenp.float64) # 样本与簇心的距离参数 聚类数目 k数据集 data初始化模式 mode最大迭代次数 max_iters闵可夫斯基距离的阶数 p 以及随机种子 seed。 初始化类的上述属性此外 self.centers 被初始化为 None表示簇心尚未计算self.clu_idx 和 self.clu_dist 被初始化为全零数组表示每个样本的分类簇和与簇心的距离。 b. 闵可夫斯基距离 def minkowski_distance(self, x, y0):return np.linalg.norm(x - y, ordself.p)使用了NumPy的 linalg.norm 函数其中 ord 参数用于指定距离的阶数。 c. 初始化簇心 def center_init(self):random.seed(self.seed)if self.mode random:ids random.sample(range(len(self.data)), kself.k) # 随机抽取k个样本下标self.centers self.data[ids] # 选取k个样本作为簇中心else:ids [random.randint(0, self.data.shape[0])]for _ in range(1, self.k):max_idx 0max_dis 0for i, x in enumerate(self.data):if i in ids:continuedis 0for y in self.data[ids]:dis self.minkowski_distance(x - y)if max_dis dis:max_dis dismax_idx iids.append(max_idx)self.centers self.data[ids]根据指定的初始化模式选择随机样本或使用 “far” 模式。 在 “random” 模式下通过随机抽样选择 k 个样本作为簇心在 “far” 模式下通过计算每个样本到已选簇心的距离之和选择距离总和最大的样本作为下一个簇心。 d. K-means聚类 def fit(self):self.center_init() # 簇心初始化for _ in range(self.max_iter):flag False # 判断是否有样本被重新分类# 遍历每个样本for i, x in enumerate(self.data):min_idx -1 # 最近簇心下标min_dist np.inf # 最小距离for j, y in enumerate(self.centers): # 遍历每个簇计算与该样本的距离# 计算样本i到簇j的距离distdist self.minkowski_distance(x, y)if min_dist dist:min_dist distmin_idx jif self.clu_idx[i] ! min_idx:# 有样本改变分类簇需要继续迭代更新簇心flag True# 记录样本i与簇的最小距离min_dist及对应簇的下标min_idxself.clu_idx[i] min_idxself.clu_dist[i] min_dist# 样本的簇划分好之后用样本均值更新簇心for i in range(self.k):x self.data[self.clu_idx i]# 用样本均值更新簇心self.centers[i] np.mean(x, axis0)if not flag:break在每次迭代中 遍历每个样本计算其到各个簇心的距离将样本分配到距离最近的簇中。更新每个簇的均值簇心为该簇内所有样本的平均值。 上述过程迭代进行直到满足停止条件样本不再重新分配到不同的簇或达到最大迭代次数。 e. 聚类结果可视化 def visualization(self, k3):current_palette sns.color_palette()sns.set_theme(contexttalk, palettecurrent_palette)for i in range(self.k):x self.data[self.clu_idx i]sns.scatterplot(xx[:, 0], yx[:, 1], alpha0.8)sns.scatterplot(xself.centers[:, 0], yself.centers[:, 1], marker, s500)plt.title(k str(k))plt.show()2. 辅助函数 def order_type(v: str):if v.lower() in (-inf, inf):return -np.inf if v.startswith(-) else np.infelse:try:return float(v)except ValueError:raise argparse.ArgumentTypeError(Unsupported value encountered)def mode_type(v: str):if v.lower() in (random, far):return v.lower()else:raise argparse.ArgumentTypeError(Unsupported value encountered) order_type 函数用于处理命令行参数中的 -p距离测量参数将字符串转换为浮点数。mode_type 函数用于处理命令行参数中的 --mode初始化模式参数将字符串转换为合法的初始化模式。 3. 主函数 a. 命令行界面 CLI 使用 argparse 解析命令行参数 parser argparse.ArgumentParser(descriptionKmeans Demo)parser.add_argument(-k, typeint, default3, helpThe number of clusters)parser.add_argument(--mode, typemode_type, defaultrandom, helpInitial centroid selection)parser.add_argument(-m, --max-iters, typeint, default40, helpMaximum iterations)parser.add_argument(-p, typeorder_type, default2., helpDistance measurement)parser.add_argument(--seed, typeint, default0, helpRandom seed)parser.add_argument(--dataset, typestr, default./kmeans.2.txt, helpPath to dataset)args parser.parse_args() b. 数据加载 从指定路径加载数据集。 dataset np.loadtxt(args.dataset)c. 模型训练及可视化 model Kmeans(kargs.k, datadataset, modeargs.mode, max_itersargs.max_iters, pargs.p,seedargs.seed)model.fit()# 聚类结果可视化model.visualization(kargs.k)4. 运行脚本的命令 通过命令行传递参数来运行脚本指定聚类数目、初始化模式、最大迭代次数等。 python kmeans.py -k 3 --mode random -m 40 -p 2 --seed 0 --dataset ./kmeans.2.txt5. 代码整合 import numpy as np import random import seaborn as sns import matplotlib.pyplot as plt import argparseclass Kmeans(object):def __init__(self, k, data: np.ndarray, moderandom, max_iters0, p2, seed0):self.k kself.data dataself.mode modeself.max_iter max_iters if max_iters 0 else int(1e8)self.p pself.seed seedself.centers Noneself.clu_idx np.zeros(len(self.data), dtypenp.int32) # 样本的分类簇self.clu_dist np.zeros(len(self.data), dtypenp.float64) # 样本与簇心的距离def minkowski_distance(self, x, y0):return np.linalg.norm(x - y, ordself.p)# 簇心初始化def center_init(self):random.seed(self.seed)if self.mode random:ids random.sample(range(len(self.data)), kself.k) # 随机抽取k个样本下标self.centers self.data[ids] # 选取k个样本作为簇中心else:ids [random.randint(0, self.data.shape[0])]for _ in range(1, self.k):max_idx 0max_dis 0for i, x in enumerate(self.data):if i in ids:continuedis 0for y in self.data[ids]:dis self.minkowski_distance(x - y)if max_dis dis:max_dis dismax_idx iids.append(max_idx)self.centers self.data[ids]def fit(self):self.center_init() # 簇心初始化for _ in range(self.max_iter):flag False # 判断是否有样本被重新分类# 遍历每个样本for i, x in enumerate(self.data):min_idx -1 # 最近簇心下标min_dist np.inf # 最小距离for j, y in enumerate(self.centers): # 遍历每个簇计算与该样本的距离# 计算样本i到簇j的距离distdist self.minkowski_distance(x, y)if min_dist dist:min_dist distmin_idx jif self.clu_idx[i] ! min_idx:# 有样本改变分类簇需要继续迭代更新簇心flag True# 记录样本i与簇的最小距离min_dist及对应簇的下标min_idxself.clu_idx[i] min_idxself.clu_dist[i] min_dist# 样本的簇划分好之后用样本均值更新簇心for i in range(self.k):x self.data[self.clu_idx i]# 用样本均值更新簇心self.centers[i] np.mean(x, axis0)if not flag:breakdef visualization(self, k3):current_palette sns.color_palette()sns.set_theme(contexttalk, palettecurrent_palette)for i in range(self.k):x self.data[self.clu_idx i]sns.scatterplot(xx[:, 0], yx[:, 1], alpha0.8)sns.scatterplot(xself.centers[:, 0], yself.centers[:, 1], marker, s500)plt.title(k str(k))plt.show()def order_type(v: str):if v.lower() in (-inf, inf):return -np.inf if v.startswith(-) else np.infelse:try:return float(v)except ValueError:raise argparse.ArgumentTypeError(Unsupported value encountered)def mode_type(v: str):if v.lower() in (random, far):return v.lower()else:raise argparse.ArgumentTypeError(Unsupported value encountered)if __name__ __main__:parser argparse.ArgumentParser(descriptionKmeans Demo)parser.add_argument(-k, typeint, default3, helpThe number of clusters)parser.add_argument(--mode, typemode_type, defaultrandom, helpInitial centroid selection)parser.add_argument(-m, --max-iters, typeint, default40, helpMaximum iterations)parser.add_argument(-p, typeorder_type, default2., helpDistance measurement)parser.add_argument(--seed, typeint, default0, helpRandom seed)parser.add_argument(--dataset, typestr, default./kmeans.2.txt, helpPath to dataset)args parser.parse_args()dataset np.loadtxt(args.dataset)model Kmeans(kargs.k, datadataset, modeargs.mode, max_itersargs.max_iters, pargs.p,seedargs.seed) # args.seed)model.fit()# 聚类结果可视化model.visualization(kargs.k)
http://www.dnsts.com.cn/news/49660.html

相关文章:

  • 聚美优品网站建设项目规划书做流媒体视频播放网站求助
  • 免费自建 响应式 网站龙泉市建设局门户网站
  • 网站首页效果图怎么做关键词优化需要从哪些方面开展
  • 做淘宝头像的网站有哪些自己怎么建个网站赚钱
  • 哪些网站可以上传自己做的视频穿越之游戏开发系统
  • 制作公司网站要多少费用呢如何判断一个网站的价值
  • 网站怎么排名马鞍山的网站建设公司
  • 广州网站建设比较好的公司自动推广软件
  • 哈尔滨网站建设兼职优化大师电脑版官网
  • 翻书效果的网站商城网站制作公司
  • seo怎么去优化淮安做网站优化
  • 全能优化型网站互联网app推广工作怎么样
  • 高端网站设计新鸿儒昆明市网站建设公司
  • 网站模版怎么上传到空间网站建设的ppt
  • 建站之星有手机版模板网站开发前如何配置电脑
  • 网站建设教学廊坊网站设计需要考虑的基本原则
  • 关于网站建设项目收取费用卯兔科技网站建设
  • 高端网站建设公司兴田德润可以不wordpress主题小工具修改
  • 海南电子商务网站手机软件商城免费下载
  • 网站建设品牌公司排名wordpress app下载模板下载
  • 网站怎么做才有百度权重html网站素材
  • 专门做娱乐场所的设计网站岳阳网站制作
  • 广西住房和城乡建设门户网站崇州市城乡建设局网站
  • 兴化 网站开发工作室做网站流程
  • wap手机网站建设wordpress添加字体颜色
  • 成都个人学做网站网站后台怎么上传图片产品
  • 泰州模板开发建站企业管理系统定制
  • 企业做网站的费用如果做账做网站销售好做吗
  • 梁山网站建设公司网站建设app开发合同范本
  • 海宁市住房和城乡规划建设局网站wordpress 默认站点