当前位置: 首页 > news >正文

房产网站制作wordpress 维文版

房产网站制作,wordpress 维文版,手机关键词排名优化,尚品网站建设一、无监督相关#xff08;聚类、异常检测#xff09; 1、常见的距离度量方法有哪些#xff1f;写一下距离计算公式。 1#xff09;连续数据的距离计算#xff1a; 闵可夫斯基距离家族#xff1a; 当p 1时#xff0c;为曼哈顿距离#xff1b;p 2时#xff0c;为欧…一、无监督相关聚类、异常检测 1、常见的距离度量方法有哪些写一下距离计算公式。 1连续数据的距离计算 闵可夫斯基距离家族 当p 1时为曼哈顿距离p 2时为欧式距离p -∞时就是切比雪夫距离。 余弦距离 其中A 和B是要比较的两个向量⋅ 表示向量的点积内积∥A∥ 和 ∥B∥ 分别表示向量 A 和 B的欧几里德范数也称为 L2 范数。余弦距离的值范围在[0,2]取值越小表示两个向量越相似取值越大表示两个向量越不相似。如果两个向量方向相同则余弦距离为 0表示完全相似如果两个向量方向相反则余弦距离为 2表示完全不相似。请注意有时也可以用余弦相似性Cosine Similarity来衡量向量的相似性它是余弦距离的补数即1−Cosine Distance。余弦相似性的取值范围在 [-1, 1]取值越大表示两个向量越相似取值越小表示越不相似。 2离散数据的距离计算 杰卡尔德Jaccard)距离AB集合的交集/A,B集合的并集 汉明距离表示两个等长字符串在对应位置上不同字符的数目 2、常见的聚类算法有哪些 主要有基于划分、基于密度、基于网络、层次聚类等除此之外聚类和其他领域也有很多结合形成的交叉领域比如半监督聚类、深度聚类、集成聚类等。 3、Kmeans的原理是什么 Kmeans是一种基于划分的聚类中心思想是类内距离尽量小类间距离尽量大主要算法过程如下 初始K个质心作为初始的K个簇的中心点K为人工设定的超参数所有样本点n分别计算和K个质心的距离这里的距离是人工定义的可以是不同距离计算方法每个样本点和k个质心中最近的质心划分为1类簇重新计算质心方法是针对簇进行聚合计算kmeans中使用简单平均的方法进行聚合计算也可以使用中位数等方式进行计算重复上述过程直到达到预定的迭代次数或质心不再发生明显变化。kmeans的损失函数是 其中||xi - cj|| 表示数据点 xi 到簇中心 cj 的欧氏距离I(condition) 是一个指示函数当 condition 成立时为 1否则为 0。J越小说明样本聚合程度越高。 4、Kmeans的初始点怎么选择不同的初始点选择有哪些缺陷该怎么解决 随机初始化随机选取K个样本点作为初始质心缺陷在于如果选择到的质心距离很接近落在同个簇内则迭代的结果可能比较差因为最终迭代出来的质心点会落在簇内。最理想的状态是K个质心正好是K个簇由于随机初始化的随机性可以考虑多次进行随机初始化选择聚合结果最优的一次。随机分取初始化即将所有样本点随机赋予1个簇的编号则所有样本点最后会有K个编号然后进行组平均即对于同一个簇的样本进行平均得到初始化质心。相对于随机初始化初始化质心会更鲁棒一些但是仍旧存在随机初始化的缺陷仅仅是缓解。 5、Kmeans聚的是特征还是样本特征的距离如何计算 一般情况下是对样本聚类如果对特征聚类则处理方式也简单对原始的输出进行转置。其目的和做相关系数类似如果两个特征高度相关例如收入和资产水平则两个特征的距离相对较小但是一般不可行因为转置后维度很高例如有100万个样本则有100万的维度计算上不现实高维数据的距离度量也是无效的不如直接计算相关系数。 6、Kmeans如何调优 初始化策略调参k的大小调参手工方法手肘法为代表数据归一化和异常样本的处理 7、介绍一下手肘法。 手肘法纵轴是聚类效果的评估指标根据具体的问题而定如果聚类是作为单独的任务存在则使用SSE损失函数或轮廓系数这类的metric作为纵坐标然后找到metric最好且k最小的结果对应的k为最终的选择。手肘法自动化时只需计算k n 和 k n1之间的斜率当斜率n和n-1斜率n1和斜率n斜率n2和斜率n1的差值均小于固定阈值时即可停止。 8、kmeans的缺点如何解决 对异常样本很敏感簇心会因为异常样本被拉得很远。异常样本是指在某些维度上取值特别大或者特别小的样本欧式距离中默认所有特征是相互独立的异常样本会产生影响。解决方法是做好预处理将异常样本剔除或者修正。K值很难确定。解决方法是针对k调参。只能拟合球形簇对于流形簇等不规则簇可能存在簇重叠的问题效果差。这种情况可能不再适用于Kmeans算法考虑换算法。无法处理离散特征缺失特征。无法保证全局最优。解决方法是跑多次取不同的局部最优里的最优。
http://www.dnsts.com.cn/news/124124.html

相关文章:

  • 国外网页设计欣赏网站网站建设类有哪些岗位
  • 视频网站自己怎么做的做水军那些网站好
  • 微擎微网站开发wordpress数据库怎么连接
  • 淄博网站建设优化运营熊掌号wordpress.org密码
  • 做外汇网站卖判刑多少年网站服务器类型
  • 网页制作模板的淘宝网站代码udacity 移动网站开发
  • 临颍网站建设网络服务遇到问题请检查网络状况或稍后再试吧
  • 微信辅助做任务网站小型商城网站
  • 响应式网站开发asp南宁本地有几家网站开发
  • 花生壳做网站wordpress评论页面
  • 南宁网站建站推广推广网络推广
  • 淮南装饰公司网站建设陷在泥里无法前进 企业解决方案
  • 专业模板网站制作价格wordpress默认图像不显示
  • 网站怎么做订单wordpress ueditor 代码 转义
  • 朱腾鹏个人网站seo网站源码
  • 代做网站公司有哪些视频网站做app开发的
  • 企业网站推广短平快珠海柏泰教育官方网站建设
  • 胶南网站建设公司酒水食品做的好网站
  • 上海网站建站多少钱进入公众号怎么找出二维码
  • 宜春建设网站公司wordpress积分兑换插件
  • 网站统计排名二七区网站建设
  • 重庆十大房地产公司重庆seo全网营销
  • 建设通网站首页网站开发用什么电脑好
  • phpstudy怎样做多个网站wordpress安装怎么切换中文
  • 工作室有专门的网站蚌埠网站制作公司哪家好
  • 恶意 镜像网站标识标牌网站怎么做
  • 企业建设网站的方式帮做图标的网站
  • 做海报素材网站推荐网站后台怎么修改文字
  • 品牌宣传型网站建设方案定制开发电商网站建设多少钱
  • 基于mvc的网站开发中铁建设集团门户网登录快照