当前位置: 首页 > news >正文

人工智能公司网站建设免费软件app网站下载大全

人工智能公司网站建设,免费软件app网站下载大全,装修公司加盟 招商加盟,重庆建工集团有限公司官网目录 一、分桶抽样 1.抽取表中10%的数据 2.抽取表中30%的数据 3.取第一行 4.取第10行 5.数据块抽样 6.tablesample详解 二、UDTF——表生成函数 1.explode()——炸裂函数 2.posexpolde()——只能对array进行炸裂 3.inline()——炸裂结构体数组 三、UDTF与侧视图的搭…目录 一、分桶抽样 1.抽取表中10%的数据 2.抽取表中30%的数据 3.取第一行 4.取第10行 5.数据块抽样 6.tablesample详解 二、UDTF——表生成函数 1.explode()——炸裂函数 2.posexpolde()——只能对array进行炸裂 3.inline()——炸裂结构体数组 三、UDTF与侧视图的搭配使用 案例一 1.炸裂likes列 注意别名不要使用关键词 2.对employee表进行炸裂 案例二 案例三hive实现WordCount 一、分桶抽样 -- 创建分桶表 create table employee_id_buckets (name string,employee_id int,work_place arraystring,gender_age structgender:string,age:int,skills_score mapstring,int,depart_title mapstring,arraystring )clustered by (employee_id) into 2 bucketsrow format delimited fields terminated by |collection items terminated by ,map keys terminated by :lines terminated by \n;-- 设置task任务数量为2桶的数量与tasks任务不同 set map.reduce.tasks2;-- 开启分桶设置 set hive.enforce.bucketingtrue;-- 加载数据 insert overwrite table employee_id_buckets select * from employee_id;-- 查询分桶表 select * from employee_id_buckets;[rootlxm147 data]# vim ./employee_id.txt Michael|100|Montreal,Toronto|Male,30|DB:80|Product:Developer:Lead Will|101|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead Steven|102|New York|Female,27|Python:80|Test:Lead,COE:Architect Lucy|103|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead Mike|104|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead Shelley|105|New York|Female,27|Python:80|Test:Lead,COE:Architect Luly|106|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead Lily|107|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead Shell|108|New York|Female,27|Python:80|Test:Lead,COE:Architect Mich|109|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead Dayong|110|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead Sara|111|New York|Female,27|Python:80|Test:Lead,COE:Architect Roman|112|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead Christine|113|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead Eman|114|New York|Female,27|Python:80|Test:Lead,COE:Architect Alex|115|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead Alan|116|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead Andy|117|New York|Female,27|Python:80|Test:Lead,COE:Architect Ryan|118|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead Rome|119|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead Lym|120|New York|Female,27|Python:80|Test:Lead,COE:Architect Linm|121|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead Dach|122|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead Ilon|123|New York|Female,27|Python:80|Test:Lead,COE:Architect Elaine|124|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead1.抽取表中10%的数据 -- 每次提取的数据一样 select * from employee_id_buckets tablesample (10 percent) s;-- 25条数据抽取10%的数据2.抽取表中30%的数据 select * from employee_id_buckets tablesample (30 percent); -- 25条数据抽取30%的数据 3.取第一行 select * from employee_id_buckets tablesample (1 rows);-- 取第1行 4.取第10行 select * from employee_id_buckets tablesample (10 rows) s;-- 取前10行5.数据块抽样 select * from employee_id_buckets tablesample (bucket 1 out of 2);建表时设置的桶的数量是2将2个桶分成两份2/21一个桶一份取第一个桶。 select * from employee_id_buckets tablesample (bucket 1 out of 2 on rand());将数据随机分到2个桶抽取第一个桶的数据。 select * from employee_id_buckets tablesample (bucket 1 out of 4 on rand()); 将数据随机分到4个桶抽取第一个桶的数据。 因此如果一个表分成了8个桶想要抽到第3个桶里面1/4的数据那么of后面就是(8/(1/4))32bucket后面就是3(代表第几个桶)。 select * from employee_id_buckets tablesample (bucket 3 out of 32 on rand()); 6.tablesample详解 抽样语句语法TABLESAMPLE(BUCKET x OUT OF y)         1.y必须是table总bucket数的倍数或者因子。 hive根据y的大小决定抽样的比例。 例如table总共分了64份当y32时抽取(64/32)2个bucket的数据当y128时抽取(64/128)1/2个bucket的数据。         2.x表示从哪个bucket开始抽取。 例如table总bucket数为32tablesample(bucket 3 out of 16)表示总共抽取32/162个bucket的数据分别为第3个bucket和第31619个bucket的数据。 二、UDTF——表生成函数 接收一行数据输出一行或多行数据。 1.explode()——炸裂函数 -- 对array进行炸裂 select explode(array(1,5,77)); -- 对map进行炸裂 select explode(map(name,zs,age,13)) as(key,value);2.posexpolde()——只能对array进行炸裂 -- 炸裂时可以输出下标 select posexplode(array(1,5,77)) as (pose,arr);3.inline()——炸裂结构体数组 -- 对结构体数组进行炸裂 select inline(array(named_struct(id, 1, name, zs),named_struct(id, 2, name, ls),named_struct(id, 3, name, ww))) as (id, name); 三、UDTF与侧视图的搭配使用 Lateral View通常与UDTF配合使用。Lateral View可以将UDTF应用到源表的每行数据将每行数据转换为一行或多行并将源表中每行的输出结果与该行连接起来形成一个虚拟表。         语法Lateral View写在from的表的后面紧接着是炸裂函数炸裂函数后面是炸裂出来的表的别名as 后面是炸裂出来的表的字段名。 案例一 有一个employee表 1.炸裂likes列 注意别名不要使用关键词 -- 炸裂likes select id, name, ll from student2 lateral view explode(likes) lk as ll; 2.对employee表进行炸裂 select name,wps,gender_age.gender,-- gender_age.gender 结构块炸裂gender_age.age,skill,score,depart,title from employeelateral view explode(workplace) place as wpslateral view explode(skills_score) skd as skill, score -- map炸成两列显示lateral view explode(depart_title) dt as depart, title; 案例二 -- 建表 create table movie_info (movie string, --电影名称category string --电影分类 )row format delimited fields terminated by \t;-- 加载数据 insert overwrite table movie_info values (《疑犯追踪》, 悬疑,动作,科幻,剧情),(《Lie to me》, 悬疑,警匪,动作,心理,剧情),(《战狼2》, 战争,动作,灾难);select explode(split(category, ,)) category from movie_info;-- 第一种炸裂写法 select t.category, count(1) num from (select explode(split(category, ,)) categoryfrom movie_info) t group by t.category;-- 炸裂函数搭配侧视图写法 select cates,count(1) num from (select split(category, ,) as catefrom movie_info) tlateral view explode(t.cate) tmp as cates group by cates;案例三hive实现WordCount hive实现WordCount的方法与案例二的第一种解法类似 -- 新建一个表 create table if not exists words(line string );-- 加载数据 load data local inpath /opt/atguigu/wordcount.txt overwrite into table words;select * from words;   -- 先将每一行数据划分为数组 select split(line, \t) word from words;-- 将数组拆分 select explode(split(line, \t)) word from words;-- 拆分后就是一个表分组计数排序 select t.word,count(1) num from (select explode(split(line, \t)) wordfrom words) t group by t.word order by num desc;
http://www.dnsts.com.cn/news/86172.html

相关文章:

  • 吉林做网站公司wordpress书籍
  • 还有哪些方法让网站更加利于seo怎么做美食的视频网站
  • 网站后台管理页面下载电子商务网站帮助中心该怎么更好地设计
  • 给别人做网站挣钱吗?怎么看一个网站做外链
  • 深圳做棋牌网站建设有哪些公司网络营销专业
  • 男女做暖昩视频试看网站世界互联网峰会
  • 汕头建设网站做网站界面用的软件
  • 成都 网站建设 公司宣传片拍摄合同
  • 做网站前段用什么软件wordpress快速开发
  • 数字营销 h5 网站开发网站备案资料申请
  • 谢岗做网站以公开的文化
  • dedecms 旅游网站模板网站不收录原因
  • 双语言网站源码有没有专门做商铺招商的网站
  • 做网站的公司跑了网站开发 flex
  • 免费国外网站模板自学网设计
  • 网站模板但没有后台如何做网站中企动力 网站模板
  • 网站代运营多少钱一个月门户设计
  • dw建设的网站怎么看临沂seo网站管理
  • 关于网站建设医院seo是什么
  • 建立网站的风险南京app研发公司
  • 网站建设营销怎么做南阳网站建设南阳
  • WordPress多站点恢复分类模板wordpress
  • react企业网站模板江苏省住房和城乡建设厅假网站
  • 自己建立公司网站为什么做网站推广
  • 企业网站建设有几种形式宁波企业网站设计
  • 做网站小程序的客户是怎么找的惠州企业自助建站
  • 网站建设待遇怎样网站建设佛
  • phpmysql网站开发怎样优化网络速度
  • 没有备案的网站怎么做淘宝客三亚论坛
  • 网站的网络营销方案手机网站绑定