当前位置: 首页 > news >正文

可以直接进入的舆情网站企业营销推广

可以直接进入的舆情网站,企业营销推广,广州网上注册公司网站,wordpress图像大小一、笔记 1.对某列进行筛选 df[(df[column1]条件1) | (df[column2]条件2) (df[column3]条件3)][[columns]]真题#xff1a; #xff08;一#xff09;条件筛选——1.大的国家#xff08;一#xff09;条件筛选——2.可回收且低脂的产品#xff08;一#xff09;…一、笔记 1.对某列进行筛选 df[(df[column1]条件1) | (df[column2]条件2) (df[column3]条件3)][[columns]]真题 一条件筛选——1.大的国家一条件筛选——2.可回收且低脂的产品一条件筛选——4.文章浏览1四数据统计——16.富有客户的数量四数据统计——18.按分类统计薪水六数据合并——26.合作过至少三次的演员和导演 2.某列是否包含/不包含另一列 df1[~df1[column1].isin(df2[column2])][[columns]]真题 一条件筛选——3.从不订购的客户六数据合并——29.至少有5名直接下属的经理六数据合并——30.销售员 3.列表重命名 # 方式一 df.rename(columns{old_column:new_column}) # 方式二 df.columns [columns]4.某列值相关属性 4.1 字符串 # 字符串长度 df[column].str.len() # 使得只有第一个字符是大写的其余都是小写的 df[column].str.capitalize() # 字符串正则表达式 df[column].str.match(正则表达式) # 字符串包含 df[column].str.contains(正则表达式)真题 二字符串函数——5.无效的推文二字符串函数——7.修复表中的名字二字符串函数——8.查找拥有有效邮箱的用户二字符串函数——9.患某种疾病的患者 4.2 函数 # 以某个字符开头 df[column].startswith(字符) # 列中前M个最大值的SeriesSeries中的最后N个元素转成dataframe df[column].nlargest(M).tail(N).to_frame() # 最大值 df[column].max() # 排名 df[column].rank(methoddense,ascendingFalse) # 去除空 df.dropna() # 求和 df[column].sum() # 最小值 df[column].min()真题 二字符串函数——6.计算特殊奖金三数据操作——10.第N高的薪水三数据操作——11.第二高的薪水三数据操作——12.部门工资最高的员工三数据操作——13.分数排名三数据操作——15.每个产品在不同商店的价格五数据分组——19.查找每个员工花费的总时间五数据分组——20.游戏玩法分析1五数据分组——23.定单最多的客户六数据合并——28.学生们参加各科测试的次数 5.对行/列进行操作 # 行 df.apply(操作, axis1) # 列 df.apply(操作, axis0)真题 二字符串函数——6.计算特殊奖金三数据操作——12.部门工资最高的员工五数据分组——24.按日期分组销售产品 6.去重 df.drop_duplicates([columns]) df.drop_duplicates(subsetcolumn,keepfirst,inplaceTrue) df.nunique()真题 三数据操作——11.第二高的薪水三数据操作——14.删除重复的电子邮箱四数据统计——16.富有客户的数量五数据分组——21.每位教师所教授的科目种类五数据分组——24.按日期分组销售产品 7.关联 # join df1.set_index(column1).join(df2.set_index(column2), howleft) # merge df1.merge(df2, on[columns], howleft, indicatorTrue) ## 笛卡尔积 df1.assign(key1).merge(df2.assign(key1), onkey).drop(key, axis1)真题 三数据操作——12.部门工资最高的员工五数据分组——24.按日期分组销售产品五数据分组——25.每天的领导和合伙人六数据合并——27.使用唯一标识码替换员工ID六数据合并——28.学生们参加各科测试的次数 8.排序 df.sort_values([column], ascendingFalse).reset_index(dropTrue)真题 三数据操作——13.分数排名三数据操作——14.删除重复的电子邮箱五数据分组——24.按日期分组销售产品 9.合并 pd.concat([df_1,df_2,df_3], axis0, ignore_indexTrue)真题 三数据操作——15.每个产品在不同商店的价格 10.分组 df.groupby(column).reset_index(namenew_column) # 分组计数 df.groupby([column]).size().reset_index(namenew_column) # 分组去重计数 df.groupby([column1])[column2].nunique().reset_index(namenew_column)真题 五数据分组——21.每位教师所教授的科目种类五数据分组——22.超过5名学生课五数据分组——23.定单最多的客户五数据分组——24.按日期分组销售产品五数据分组——25.每天的领导和合伙人六数据合并——26.合作过至少三次的演员和导演六数据合并——29.至少有5名直接下属的经理 二、真题 一条件筛选 1.大的国家 如果一个国家满足下述两个条件之一则认为该国是大国面积至少为300万平方公里即3000000km2或者人口至少为 2500万即25000000 编写解决方案找出大国的国家名称、人口和面积。按 任意顺序返回结果表。 import pandas as pddef big_countries(world: pd.DataFrame) - pd.DataFrame:return world[(world[area] 3000000) | (world[population] 25000000)][[name,population,area]]2.可回收且低脂的产品 编写解决方案找出既是低脂又是可回收的产品编号。返回结果 无顺序要求 。 import pandas as pddef find_products(products: pd.DataFrame) - pd.DataFrame:return products[(products[low_fats] Y) (products[recyclable] Y)][[product_id]]3.从不订购的客户 找出所有从不点任何东西的顾客。以任意顺序返回结果表。 import pandas as pddef find_customers(customers: pd.DataFrame, orders: pd.DataFrame) - pd.DataFrame:return customers[~customers[id].isin(orders[customerId])][[name]].rename(columns{name:Customers})4.文章浏览1 请查询出所有浏览过自己文章的作者结果按照 id 升序排列。 import pandas as pddef article_views(views: pd.DataFrame) - pd.DataFrame:return views[views[author_id] views[viewer_id]][[viewer_id]].rename(columns{viewer_id:id}).drop_duplicates().sort_values(by[id])5.无效的推文 查询所有无效推文的编号ID。当推文内容中的字符数严格大于 15 时该推文是无效的。以任意顺序返回结果表。 import pandas as pddef invalid_tweets(tweets: pd.DataFrame) - pd.DataFrame:return tweets[tweets[content].str.len() 15][[tweet_id]]6.计算特殊奖金 编写解决方案计算每个雇员的奖金。如果一个雇员的 id 是 奇数 并且他的名字不是以 ‘M’ 开头那么他的奖金是他工资的 100% 否则奖金为 0 。返回的结果按照 employee_id 排序。 import pandas as pddef calculate_nonus(row):if row[employee_id] % 2 1 and not row[name].startswith(M):return row[salary]else:return 0def calculate_special_bonus(employees: pd.DataFrame) - pd.DataFrame:employees[salary] employees.apply(calculate_nonus, axis1)return employees[[employee_id,salary]].rename(columns{salary:bonus}).sort_values(byemployee_id)7.修复表中的名字 编写解决方案修复名字使得只有第一个字符是大写的其余都是小写的。返回按 user_id 排序的结果表。 import pandas as pddef fix_names(users: pd.DataFrame) - pd.DataFrame:users[name] users[name].str.capitalize()return users.sort_values(by[user_id])8.查找拥有有效邮箱的用户 编写一个解决方案以查找具有有效电子邮件的用户。一个有效的电子邮件具有前缀名称和域其中 前缀 名称是一个字符串可以包含字母大写或小写数字下划线 ‘_’ 点 ‘.’ 和/或破折号 ‘-’ 。前缀名称 必须 以字母开头。域 为 ‘leetcode.com’ 。以任何顺序返回结果表。 import pandas as pddef valid_emails(users: pd.DataFrame) - pd.DataFrame:return users[users[mail].str.match(r^[a-zA-Z][a-zA-Z0-9_.\-]*leetcode\.com$)]9.患某种疾病的患者 查询患有 I 类糖尿病的患者 ID patient_id、患者姓名patient_name以及其患有的所有疾病代码conditions。I 类糖尿病的代码总是包含前缀 DIAB1 。按 任意顺序 返回结果表。 import pandas as pddef find_patients(patients: pd.DataFrame) - pd.DataFrame:return patients[patients[conditions].str.contains(r\bDIAB1\w*, regexTrue)]10.第N高的薪水 查询 Employee 表中第 n 高的工资。如果没有第 n 个最高工资查询结果应该为 null 。 import pandas as pddef nth_highest_salary(employee: pd.DataFrame, N: int) - pd.DataFrame:employee employee.drop_duplicates(salary)return employee[salary].nlargest(N).tail(1).to_frame() if employee.shape[0]N else pd.DataFrame()11.第二高的薪水 查询并返回 Employee 表中第二高的薪水 。如果不存在第二高的薪水查询应该返回 null(Pandas 则返回 None) 。 import pandas as pddef second_highest_salary(employee: pd.DataFrame) - pd.DataFrame:employee employee.drop_duplicates(salary)return employee[salary].nlargest(2).tail(1).to_frame().rename(columns{salary:SecondHighestSalary}) if employee.shape[0]2 else pd.DataFrame([None], columns[SecondHighestSalary])12.部门工资最高的员工 查找出每个部门中薪资最高的员工。按 任意顺序 返回结果表。 import pandas as pddef department_highest_salary(employee: pd.DataFrame, department: pd.DataFrame) - pd.DataFrame:df employee.set_index(departmentId).join(department.rename(columns{name:Department}).set_index(id), howleft)return df.groupby(Department).apply(lambda x:x[x[salary]x[salary].max()])[[Department,name,salary]].rename(columns{name:Employee,salary:Salary})13.分数排名 查询并对分数进行排序。排名按以下规则计算:分数应按从高到低排列。如果两个分数相等那么两个分数的排名应该相同。在排名相同的分数后排名数应该是下一个连续的整数。换句话说排名之间不应该有空缺的数字。按 score 降序返回结果表。 import pandas as pddef order_scores(scores: pd.DataFrame) - pd.DataFrame:scores scores.sort_values([score], ascendingFalse).reset_index(dropTrue)scores[rank] scores[score].rank(methoddense,ascendingFalse)return scores[[score,rank]]14.删除重复的电子邮箱 编写解决方案 删除 所有重复的电子邮件只保留一个具有最小 id 的唯一电子邮件。对于 SQL 用户请注意你应该编写一个 DELETE 语句而不是 SELECT 语句。对于 Pandas 用户请注意你应该直接修改 Person 表。运行脚本后显示的答案是 Person 表。驱动程序将首先编译并运行您的代码片段然后再显示 Person 表。Person 表的最终顺序 无关紧要 。 import pandas as pd# Modify Person in place def delete_duplicate_emails(person: pd.DataFrame) - None:if len(person):person.sort_values(by[id], inplaceTrue)return person.drop_duplicates(subsetemail,keepfirst,inplaceTrue) else:return None15.每个产品在不同商店的价格 请你重构 Products 表查询每个产品在不同商店的价格使得输出的格式变为(product_id, store, price) 。如果这一产品在商店里没有出售则不输出这一行。输出结果表中的 顺序不作要求 。 import pandas as pddef rearrange_products_table(products: pd.DataFrame) - pd.DataFrame:df_1 products[[product_id, store1]].rename(columns{store1:price}).dropna()df_1[store] store1df_2 products[[product_id, store2]].rename(columns{store2:price}).dropna()df_2[store] store2df_3 products[[product_id, store3]].rename(columns{store3:price}).dropna()df_3[store] store3df pd.concat([df_1,df_2,df_3], axis0, ignore_indexTrue)[[product_id,store,price]]return df16.富有客户的数量 编写解决方案找出 至少有一个 订单的金额 严格大于 500 的客户的数量。 import pandas as pddef count_rich_customers(store: pd.DataFrame) - pd.DataFrame:return pd.DataFrame({rich_count: store[store[amount] 500][[customer_id]].nunique()})17.即时食物配送 如果顾客期望的配送日期和下单日期相同则该订单称为 「即时订单」否则称为「计划订单」。编写解决方案统计即时订单所占的百分比 保留两位小数。 import pandas as pddef food_delivery(delivery: pd.DataFrame) - pd.DataFrame:return pd.DataFrame({immediate_percentage: [round(len(delivery[delivery[order_date]delivery[customer_pref_delivery_date]])/len(delivery)*100, 2)]})18.按分类统计薪水 查询每个工资类别的银行账户数量。 工资类别如下 “Low Salary”所有工资 严格低于 20000 美元。 “Average Salary” 包含 范围内的所有工资 [$20000, $50000] 。 “High Salary”所有工资 严格大于 50000 美元。 结果表 必须 包含所有三个类别。 如果某个类别中没有帐户则报告 0 。按 任意顺序 返回结果表。 import pandas as pddef count_salary_categories(accounts: pd.DataFrame) - pd.DataFrame:return pd.DataFrame({category:[Low Salary,Average Salary,High Salary],accounts_count:[len(accounts[accounts[income]20000]),len(accounts[(accounts[income]20000) (accounts[income]50000)]),len(accounts[accounts[income]50000])]})19.查找每个员工花费的总时间 计算每位员工每天在办公室花费的总时间以分钟为单位。 请注意在一天之内同一员工是可以多次进入和离开办公室的。 在办公室里一次进出所花费的时间为out_time 减去 in_time。返回结果表单的顺序无要求。 import pandas as pddef total_time(employees: pd.DataFrame) - pd.DataFrame:employees[difference] employees[out_time] - employees[in_time]return employees.groupby([emp_id,event_day])[difference].sum().reset_index()[[event_day,emp_id,difference]].rename(columns{event_day:day,difference:total_time})20.游戏玩法分析1 查询每位玩家 第一次登陆平台的日期。 import pandas as pddef game_analysis(activity: pd.DataFrame) - pd.DataFrame:return activity.groupby(player_id)[event_date].min().reset_index().rename(columns{event_date:first_login})21.每位教师所教授的科目种类 import pandas as pddef count_unique_subjects(teacher: pd.DataFrame) - pd.DataFrame:return teacher.groupby(teacher_id)[subject_id].nunique().reset_index(namecnt)22.超过5名学生课 查询 至少有5个学生 的所有班级。以 任意顺序 返回结果表。 import pandas as pddef find_classes(courses: pd.DataFrame) - pd.DataFrame:courses courses.groupby([class]).size().reset_index(namecount)return courses[courses[count]5][[class]]23.定单最多的客户 查找下了 最多订单 的客户的 customer_number 。测试用例生成后 恰好有一个客户 比任何其他客户下了更多的订单。 import pandas as pddef largest_orders(orders: pd.DataFrame) - pd.DataFrame:orders orders.groupby([customer_number]).size().reset_index(namecount)return orders[orders[count]orders[count].max()][[customer_number]]24.按日期分组销售产品 编写解决方案找出每个日期、销售的不同产品的数量及其名称。每个日期的销售产品名称应按词典序排列。返回按 sell_date 排序的结果表。 import pandas as pddef categorize_products(activities: pd.DataFrame) - pd.DataFrame:activities activities.drop_duplicates().sort_values(byproduct)activities_num_sold activities.groupby(sell_date).size().reset_index(namenum_sold)activities_products activities.groupby(sell_date)[product].apply(,.join).reset_index(nameproducts)return activities_num_sold.set_index(sell_date).join(activities_products.set_index(sell_date), howleft).reset_index()25.每天的领导和合伙人 对于每一个 date_id 和 make_name找出 不同 的 lead_id 以及 不同 的 partner_id 的数量。按 任意顺序 返回结果表。 import pandas as pddef daily_leads_and_partners(daily_sales: pd.DataFrame) - pd.DataFrame:daily_sales_unique_leads daily_sales.groupby([date_id,make_name])[lead_id].nunique().reset_index(nameunique_leads)daily_sales_unique_partners daily_sales.groupby([date_id,make_name])[partner_id].nunique().reset_index(nameunique_partners)return daily_sales_unique_leads.set_index([date_id,make_name]).join(daily_sales_unique_partners.set_index([date_id,make_name]), howleft).reset_index()26.合作过至少三次的演员和导演 编写解决方案找出合作过至少三次的演员和导演的 id 对 (actor_id, director_id) import pandas as pddef actors_and_directors(actor_director: pd.DataFrame) - pd.DataFrame:actor_director actor_director.groupby([actor_id,director_id]).size().reset_index(namecnt)return actor_director[actor_director[cnt]3][[actor_id,director_id]]27.使用唯一标识码替换员工ID 展示每位用户的 唯一标识码unique ID 如果某位员工没有唯一标识码使用 null 填充即可。你可以以 任意 顺序返回结果表。 import pandas as pddef replace_employee_id(employees: pd.DataFrame, employee_uni: pd.DataFrame) - pd.DataFrame:return employee_uni.set_index(id).join(employees.set_index(id), howright).reset_index()[[unique_id,name]]28.学生们参加各科测试的次数 查询出每个学生参加每一门科目测试的次数结果按 student_id 和 subject_name 排序。 import pandas as pd import numpy as npdef students_and_examinations(students: pd.DataFrame, subjects: pd.DataFrame, examinations: pd.DataFrame) - pd.DataFrame:students students.assign(key1).merge(subjects.assign(key1), onkey).drop(key, axis1)students students.merge(examinations, on[student_id, subject_name], howleft, indicatorTrue)students[attended_exams] (students[_merge] both).astype(int)return students.groupby([student_id, student_name, subject_name])[attended_exams].sum().reset_index()29.至少有5名直接下属的经理 查询至少有5名直接下属的经理 。以 任意顺序 返回结果表。 import pandas as pddef find_managers(employee: pd.DataFrame) - pd.DataFrame:employee_cnt employee.groupby([managerId]).size().reset_index(namecnt)return employee[employee[id].isin(employee_cnt[employee_cnt[cnt]5][managerId])][[name]]30.销售员 编写解决方案找出没有任何与名为 “RED” 的公司相关的订单的所有销售人员的姓名。以 任意顺序 返回结果表。 import pandas as pddef sales_person(sales_person: pd.DataFrame, company: pd.DataFrame, orders: pd.DataFrame) - pd.DataFrame:return sales_person[~sales_person[sales_id].isin(orders[orders[com_id].isin(company[company[name]RED][com_id])][[sales_id]][sales_id])][[name]]
http://www.dnsts.com.cn/news/123444.html

相关文章:

  • 给你一个网站怎么做的房子如何上网站做民宿
  • wap网站开发多少钱石家庄做公司网站
  • 网站换域名有没有影响吗商业摄影网站
  • 泉州免费建站模板快速建设企业门户网站
  • 网站建设方案word电商有哪些类目
  • 请人做游戏的网站网站要怎么备案
  • 网站开发发展趋势查商标官网
  • 9免费建网站贵州建设网站
  • 宝丰县建设局网站做网站建设的利润
  • 汽配做的最好的网站宝塔网站建设
  • 沈阳建网站平台做网站哪家好 青岛
  • joomla做类似赶集网的网站乐清手机网站
  • 床上爱做网站广西网站设计运营公司
  • 网络工程师证书考试内容seo策略
  • 网站备案抽查号码会员积分系统
  • 网站建设付费项目购物网站 怎么做
  • 国内较好的网站设计公司镇平网站建设
  • mvc 门户网站开发框架湖州网络推广
  • 怎么做网站内容调研网站翻页
  • 在本地怎么做网站有没有淄博张店做兼职工作的网站
  • 温州建设网站网站开发代理商
  • 应聘网站建设工程师宝安网站建设多少钱
  • 大连免费模板建站网站死链怎么办
  • 微商城网站建设案例京东网站建设评估
  • 可以做同城活动的网站黑龙江省建设教育协会网站首页
  • 微信网站如何制作做网站 聊城
  • 酒店网站建设策划书怎么写零起飞网站建设工作室
  • 东莞 网站建设平台推广
  • 怎么做电影网站页面的学校网站建设及使用档案
  • 手机网站建设的行情网站建设crm