当前位置: 首页 > news >正文

网站程序制作佛山新网站建设服务公司

网站程序制作,佛山新网站建设服务公司,网站规划与建设步骤,免费ui设计网站1.理论知识 Apriori是一种常用的数据关联规则挖掘方法#xff0c;它可以用来找出数据集中频繁出现的数据集合。该算法第一次实现在大数据集上的可行的关联规则提取#xff0c;其核心思想是通过连接产生候选项及其支持度#xff0c;然后通过剪枝生成频繁项集。 Apriori算法的…1.理论知识 Apriori是一种常用的数据关联规则挖掘方法它可以用来找出数据集中频繁出现的数据集合。该算法第一次实现在大数据集上的可行的关联规则提取其核心思想是通过连接产生候选项及其支持度然后通过剪枝生成频繁项集。 Apriori算法的主要思想是找出存在于事务数据集中最大的频繁项集再利用得到的最大频繁项集与预先设定的最小置信度阈值生成强关联规则。 图1.1关键名词解释 2.算法流程图 3.实现代码 def item(dataset): # 求第一次扫描数据库后的 候选集c1 [] # 存放候选集元素for x in dataset: # 求这个数据库中出现了几个元素然后返回for y in x:if [y] not in c1:c1.append([y])c1.sort()return c1# 计算支持度 def get_frequent_item(dataset, c, min_support):cut_branch {} # 用来存放所有项集的支持度的字典for x in c:for y in dataset:if set(x).issubset(set(y)):cut_branch[tuple(x)] cut_branch.get(tuple(x),0) 1Fk [] # 支持度大于最小支持度的项集 即频繁项集sup_dataK {} # 用来存放所有 频繁 项集的支持度的字典for i in cut_branch:if cut_branch[i] min_support:Fk.append(list(i))sup_dataK[i] cut_branch[i]return Fk, sup_dataK# 计算候选集 def get_candidate(Fk, K): # 求第k次候选集ck [] # 存放产生候选集for i in range(len(Fk)):for j in range(i 1, len(Fk)):L1 list(Fk[i])[:K - 2].sort()L2 list(Fk[j])[:K - 2].sort()if L1 L2:if K 2:new list(set(Fk[i]) ^ set(Fk[j]))else:new set()for x in Fk:if set(new).issubset(set(x)) and list(set(Fk[i]) | set(Fk[j])) not in ck:ck.append(list(set(Fk[i]) | set(Fk[j])))return ck# Apriori算法 def Apriori(dataset, min_support2):c1 item(dataset)f1, sup_1 get_frequent_item(dataset, c1, min_support)F [f1]sup_data sup_1K 2while len(F[K - 2]) 1:ck get_candidate(F[K - 2], K) # 求第k次候选集fk, sup_k get_frequent_item(dataset, ck, min_support)F.append(fk) # 把新产生的候选集假如Fsup_data.update(sup_k) # 字典更新加入新得出的数据K 1return F, sup_data # 返回所有频繁项集 以及存放频繁项集支持度的字典 Apriori算法 定义A 1, B 2, C 3, D 4, E 51 [A C D] 1 3 4 2 [B C E] 2 3 5 3 [A B C E] 1 2 3 5 4 [B E] 2 5min_support 2 # 主函数 if __name__ __main__:# 数据dataset [[1, 3, 4],[2, 3, 5],[1, 2, 3, 5],[2, 5]]# 最小支持度设置为2min_support 2F, sup_data Apriori(dataset, min_support)print(最小支持度为:\n , min_support)print(------------------------------------------------------)print(已知关系:\n , dataset)print(------------------------------------------------------)print(所有的频繁项为:\n {}.format(F))print(------------------------------------------------------)print(对应的支持度为:\n {}.format(sup_data))4.实验结果 测试数据 表1 Apriori算法输入的数据 (最小支持度设置为2) 序号 数据项 替换 1 [A C D] 1 3 4 2 [B C E] 2 3 5 3 [A B C E] 1 2 3 5 4 [B E] 2 5 实验结果与分析 图 1.2 Apriori关联规则算法实验结果 算法优缺点 优点 Aprioi算法采用逐层搜索的迭代方法算法简单易于实现。数据采用水平组织方式采用Apriori 优化方法适合事务数据库的关联规则挖掘。适合稀疏数据集:根据以往的研究,该算法只能适合稀疏数据集的关联规则挖掘也就是频繁项目集的长度稍小的数据集。 缺点 对数据库的扫描次数过多。Apion算法可能产生大量的候选项集。在频繁项目集长度变大的情况下,运算时间显著增加。采用唯一支持度,没有考虑各个属性重要程度的不同。算法的适应面窄。 其他实验我是芒果酱点一个关注吧(σ′▽‵)′▽‵)σ k-Means聚类算法 HNUST【数据分析技术】(2024)-CSDN博客PageRank Web页面分级算法 HNUST【数据分析技术】(2024)-CSDN博客KNN分类算法 HNUST【数据分析技术】(2024)-CSDN博客Apriori关联规则算法 HNUST【数据分析技术】(2024)-CSDN博客
http://www.dnsts.com.cn/news/77210.html

相关文章:

  • 江西建设门户网站做营销的有那么网站
  • 个人建设网站需要什么证件吗网站建设教程搭建
  • 网站的特征网站半年了 没有流量
  • 淘宝店网站建设四川建筑工程网
  • 泉州专业网站建设哪家好贵州建设官方网站
  • 中山精品网站建设公司泰安房产网签住宅
  • 东莞企业网站排名centos 网站搭建
  • 鄂州北京网站建设wordpress 如何改中文字体
  • 网站建设 公司 天津c 做网站好嘛
  • 做游戏试玩网站企业型网站建设步骤及注意事项
  • 怎样用代码做网站一个主体可以备案几个网站
  • 网站开发中所需要的绘图工具wordpress4.8
  • 网站开发常用字体王占山将军简介
  • 网站浮动条进贤网站建设
  • 网站设计的开发工具和环境wordpress文章rss
  • 网站分类查询p2p提供网站建设违法
  • 北京做网站个人苏州门户网站建设
  • 西北网站建设做网站电商云数据库有用吗
  • 廊坊做网站厂商定制建筑设计学什么的
  • 公司门户网站及oa系统建设的请示物流网站建设规划总结
  • 品牌型网站成功案例图片长链接转短链接
  • 集团网站建设的好处资源下载网站wordpress
  • 济南网站制作推广网站原型图大小
  • 大庆建设网站表格下载老鹰画室网站哪家做的
  • 兰州网站优化seo百度一下官网搜索引擎
  • 网站开发的开发语言网站建设 镇江丹阳
  • 网站站建设建技设术技术wordpress企业官网主题下载
  • 网站怎么做qq微信登陆界面设计网站小边框元素使用
  • 成都网站建设怎么样网站静态化
  • 阿里巴巴网站建设教程视频淄博网络优化哪家专业