当前位置: 首页 > news >正文

网站排名优化学习哈尔滨建工建设

网站排名优化学习,哈尔滨建工建设,wordpress博客转发,电子政务网站课程设计全文链接#xff1a;https://tecdat.cn/?p38026 分析师#xff1a;Fanghui Shao 在当今金融领域#xff0c;风险管控至关重要。无论是汽车贷款违约预测、银行挖掘潜在贷款客户#xff0c;还是信贷风控模型的构建#xff0c;以及基于决策树的银行信贷风险预警#xff0c;… 全文链接https://tecdat.cn/?p38026 分析师Fanghui Shao 在当今金融领域风险管控至关重要。无论是汽车贷款违约预测、银行挖掘潜在贷款客户还是信贷风控模型的构建以及基于决策树的银行信贷风险预警都是金融机构面临的关键挑战点击文末“阅读原文”获取合集完整代码数据。 相关视频 本银行信贷风控专题合集将通过代码和数据案例深入探讨这些金融场景中的问题与解决方案通过对数据的深入分析、模型的构建与优化为金融机构提供有效的风险管控策略以促进金融市场的稳定与健康发展。 汽车贷款违约预测 作为违约预测类项目本项目同样拥有数据不均衡的问题即违约的数据相较于不违约的数据占比较小。此外若不对数据进行深度理解、处理模型的训练结果十分糟糕F1分数仅有0.01。 解决方案 任务/目标 本项目以F1分数和准确率为评判标准通过对数据的处理机器学习模型的训练尽可能提高违约预测的有效性。 数据预处理 查看数据的分布情况对ID等无效特征进行剔除。 通过查看特征之间的相关性去掉与其他特征相关性95%以上的特征避免多重共线性。 对于形式为“X年X月”的特征转换为月份数以此将字符串数据转换为数值型数据。 对于文字类数据通过对各个种类的理解用数字划分信用等级数字越高代表借款人信用记录越好。 特征包含了主要账户和次要账户的各种信息此处将两个账户的信息合并例如将主要账户余额、第二账户余额合并。 由于很多特征对于大部分借款人来说是0因此新增一个特征记录每个借款人之前所有特征中数值为0的个数。 以上例举的只是部分特征。 构造 以上说明了如何抽取相关特征我们大致有如下训练样本只列举部分特征。   划分训练集和测试集 考虑到最终模型会预测将来的某时间段的销量为了更真实的测试模型效果切分训练集和验证集。具体做法如下利用train\_test\_split()函数进行训练集、验证集划分将30%的数据作为验证集用于对机器学习模型调参。 建模 线性模型利用AWS Sagemaker中的LinearLearner模型作为基准通过对XGBoost模型的训练调参以得到更好的预测效果。 XGBoost: XGBoost是boosting算法的其中一种。Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。因为XGBoost是一种提升树模型所以它是将许多树模型集成在一起形成一个很强的分类器。 模型优化 优化方法参数调参 结果   在此案例中通过对数据的处理即使最基本的线性模型也有0.6的F1分数比最初的0.01有了大幅提高。此外通过利用AWS Sagemaker的Hyperparameter Tuning相关函数对XGBoost模进行调参、训练最终F1结果达到了0.8以上有了显著提升。对汽车贷款违约预测有效性有了大幅提高。 点击标题查阅往期内容 PYTHON用户流失数据挖掘建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像 左右滑动查看更多 01 02 03 04 Python决策树、随机森林、朴素贝叶斯、KNNK-最近邻居分类分析银行拉新活动挖掘潜在贷款客户|附数据代码 最近我们被客户要求撰写关于银行拉新活动的研究报告包括一些图形和统计输出。 项目背景银行的主要盈利业务靠的是贷款这些客户中的大多数是存款大小不等的责任客户存款人。银行拥有不断增长的客户 该银行希望增加借款人资产客户开展更多的贷款业务并通过贷款利息赚取更多利润。因此银行希望将负债的客户转换为个人贷款客户。同时保留他们作为存款人。该银行去年针对负债客户开展的一项活动显示成功实现了9以上的成功转化率。该部门希望建立一个模型来帮助他们确定购买贷款可能性更高的潜在客户。可以增加成功率同时降低成本。 数据集 下面给出的文件包含5000个客户的数据  查看文末了解数据获取方式  。数据包括客户人口统计信息年龄收入等客户与银行的关系抵押证券账户等以及客户对上次个人贷款活动的因变量个人贷款。在这5000个客户中只有480个 9.6接受了先前活动中提供给他们的个人贷款 data.head() data.columns 属性信息 属性可以相应地划分 变量 ID 一个人的客户ID与贷款之间没有关联也无法为将来的潜在贷款客户提供任何一般性结论。我们可以忽略此信息进行模型预测。 二进制类别具有五个变量如下所示 个人贷款-该客户是否接受上一个广告系列提供的个人贷款 这是我们的目标变量证券帐户-客户在银行是否有证券帐户CD帐户-客户在银行是否有存款证明CD帐户网上银行-客户是否使用网上银行信用卡-客户是否使用银行发行的信用卡 数值变量如下 年龄-客户的年龄工作经验收入-年收入元CCAvg-平均信用卡消费抵押-房屋抵押价值 有序分类变量是 家庭-客户的家庭人数教育程度-客户的教育程度 标称变量是 ID邮政编码 data.shape # 文件中没有列有空数据data.apply(lambda x : sum(x.isnull())) 两两变量散点图 年龄 特征通常是分布的大多数客户年龄在30岁到60岁之间。经验 大多分布在8年以上经验的客户。这里的 平均值 等于中 位数。有负数 。这可能是数据输入错误因为通常无法衡量负数的工作经验。我们可以删除这些值因为样本中有3或4条记录。收入出现 正偏斜。大多数客户的收入在45,000到55K之间。我们可以通过说平均值 大于 中位数来确认这一点CCAvg 也是一个正偏变量平均支出在0K到10K之间大多数支出不到2.5K抵押 70的人的抵押贷款少于4万。但是最大值为635K家庭和教育变量是序数变量。家庭分布均匀 有52条记录经验为负数。在进一步进行之前我们需要对这些记录进行清理 有52条负数经验的记录 以下代码执行以下步骤 对于具有ID的记录获取Age column的值对于具有ID的记录获取Education column的值从具有正数经验的记录的数据框中过滤符合以上条件的记录并取中位数将中位数填充原本负数经验的位置 data.loc\[np.where(\[ID\]id)\]\[Education\].tolist()\[0\]df_filtered\[Experience\].median()# 检查是否有负数经验的记录data\[data\[Experience\]  0\]\[Experience\].count()收入和教育对个人贷款的影响 观察 看来教育程度为1的客户收入更高。但是接受了个人贷款的客户的收入水平相同 推论 从上图可以看出没有个人贷款的客户和拥有个人贷款的客户的抵押贷款较高。 观察 大多数没有贷款的客户都有证券账户 观察家庭人数对个人贷款没有任何影响。但是似乎3岁的家庭更有可能借贷。考虑未来的推广活动时这可能是一个很好的观察结果。 观察没有CD帐户的客户也没有贷款。这似乎占多数。但是几乎所有拥有CD帐户的客户也都有贷款 观察该图显示有个人贷款的人的信用卡平均费用更高。平均信用卡消费中位数为3800元表明个人贷款的可能性更高。较低的信用卡支出中位数为1400元不太可能获得贷款。这可能是有用的信息。 观察 上图显示与经验和年龄呈正相关。随着经验的增加年龄也会增加。颜色也显示教育程度。四十多岁之间存在差距大学以下的人也更多 # 与热图的关联性corr  data.corr()plt.figure(figsize(13,7))# 创建一个掩码以便我们只看到一次相关的值a  sns.heatmap(corr,maskmask, annotTrue, fmt.2f) 观察 收入和CCAvg呈中等相关。年龄和工作经验高度相关 看下面的图收入低于10万的家庭比高收入的家庭更不可能获得贷款。 应用模型 将数据分为训练集和测试集 train\_labels  train\_settest\_labels  test\_set 决策树分类器 DecisionTreeClassifier(class\_weightNone, criterionentropy, ...)dt\_model.score0.9773333333333334dt\_model.predict(test\_set)查看测试集 test_set.head(5) 朴素贝叶斯 naive\_model.fit(train\_set, train\_labels)naive\_model.score0.8866666666666667 随机森林分类器 randomforest\_model.score(test\_set,test_labels)0.8993333333333333 KNNK-最近邻居 data.drop(\[Experience ,ID\] , axis  1).drop(labels PersonalLoan , axis  1)train\_set\_dep  data\[PersonalLoan\]acc  accuracy\_score(Y\_Test, predicted)print(acc)0.9106070713809206 模型比较 for name, model in models:kfold  model\_selection.KFold(n\_splits10)cv\_results  model\_selection.cross\_val\_score(model, X, y, cv, scoring)# 箱线图算法的比较plt.figure() 结论 通用银行的目的是将负债客户转变为贷款客户。他们想发起新的营销活动因此他们需要有关数据中给出的变量之间的有联系的信息。本研究使用了四种分类算法。从上图可以看出随机森林 算法似乎 具有最高的精度我们可以选择它作为最终模型。 Python信贷风控模型梯度提升Adaboost,XGBoost,SGD, GBOOST, SVC,随机森林, KNN预测金融信贷违约支付和模型优化 |附数据代码 最近我们被客户要求撰写关于信贷风控模型的研究报告包括一些图形和统计输出。 在此数据集中我们必须预测信贷的违约支付并找出哪些变量是违约支付的最强预测因子以及不同人口统计学变量的类别拖欠还款的概率如何变化 有25个变量 1. ID 每个客户的ID2. LIMIT_BAL 金额3. SEX 性别1 男2 女4.教育程度1 研究生2 本科3 高中4 其他5 未知5.婚姻 婚姻状况1 已婚2 单身3 其他6.年龄7.  PAY_0  2005年9月的还款状态-1 正常付款1 延迟一个月的付款2 延迟两个月的付款8 延迟八个月的付款9 延迟9个月以上的付款8. PAY_2  2005年8月的还款状态与上述相同9. PAY_3 2005年7月的还款状态与上述相同10. PAY_4  2005年6月的还款状态与上述相同11. PAY_5  2005年5月的还款状态与上述相同12. PAY_6 还款状态2005年4月 的账单与上述相同13. BILL_AMT1 2005年9月的账单金额14. BILL_AMT2  2005年8月的账单金额15. BILL_AMT3 账单金额2005年7月 的账单金额16. BILL_AMT4 2005年6月的账单金额17. BILL_AMT5  2005年5月的账单金额18. BILL_AMT6 2005年4月19. PAY_AMT1  2005年9月先前支付金额20. PAY_AMT2  2005年8月以前支付的金额21. PAY_AMT3 2005年7月的先前付款22. PAY_AMT4  2005年6月的先前付款23. PAY_AMT5  2005年5月的先前付款24. PAY_AMT6 先前的付款额在2005年4月25. default.payment.next.month 默认付款1 是0 否 现在我们知道了数据集的整体结构。因此让我们应用在应用机器学习模型时通常应该执行的一些步骤。 第1步导入 import numpy as npimport matplotlib.pyplot as plt 所有写入当前目录的结果都保存为输出。 dataset  pd.read_csv(Card.csv) 现在让我们看看数据是什么样的 第2步数据预处理和清理 dataset.shape(30000, 25) 意味着有30,000条目包含25列 从上面的输出中可以明显看出任何列中都没有对象类型不匹配。 #检查数据中Null项的数量按列计算。dataset.isnull().sum() 步骤3.数据可视化和探索性数据分析 # 按性别检查违约者和非违约者的计数数量sns.countplot 从上面的输出中可以明显看出与男性相比女性的整体拖欠付款更少 可以明显看出那些拥有婚姻状况的人的已婚状态人的默认拖欠付款较少。 sns.pairplot sns.jointplot 男女按年龄分布 g.map(plt.hist,AGE) dataset\[LIMIT_BAL\].plot.density 步骤4.找到相关性 X.corrwith 从上图可以看出最负相关的特征是LIMIT_BAL但我们不能盲目地删除此特征因为根据我的看法这对预测非常重要。ID无关紧要并且在预测中没有任何作用因此我们稍后将其删除。 # 绘制热图sns.heatmap(corr) 步骤5将数据分割为训练和测试集 训练数据集和测试数据集必须相似通常具有相同的预测变量或变量。它们在变量的观察值和特定值上有所不同。如果将模型拟合到训练数据集上则将隐式地最小化误差。拟合模型为训练数据集提供了良好的预测。然后您可以在测试数据集上测试模型。如果模型在测试数据集上也预测良好则您将更有信心。因为测试数据集与训练数据集相似但模型既不相同也不相同。这意味着该模型在真实意义上转移了预测或学习。 因此通过将数据集划分为训练和测试子集我们可以有效地测量训练后的模型因为它以前从未看到过测试数据因此可以防止过度拟合。 我只是将数据集拆分为20的测试数据其余80将用于训练模型。 train\_test\_split(X, y, test\_size  0.2, random\_state  0) 步骤6规范化数据特征标准化 对于许多机器学习算法而言通过标准化或Z分数标准化进行特征标准化可能是重要的预处理步骤。 许多算法例如SVMK近邻算法和逻辑回归都需要对特征进行规范化 min\_test  X\_test.min()range\_test  (X\_test - min\_test).max()X\_test\_scaled  (X\_test - min\_test)/range\_test 步骤7应用机器学习模型 from sklearn.ensemble  import AdaBoostClassifieradaboost AdaBoostClassifier() xgb\_classifier.fit(X\_train\_scaled, y\_train,verboseTrue)endtime()train\_time\_xgbend-start 应用具有100棵树和标准熵的随机森林 classifier  RandomForestClassifier(random\_state  47,criterion  entropy,n\_estimators100) svc_model  SVC(kernelrbf, gamma0.1,C100) knn  KNeighborsClassifier(n_neighbors  7) 步骤8分析和比较机器学习模型的训练时间 Train\_Time  \[train\_time\_ada,train\_time\_xgb,train\_time\_sgd,train\_time\_svc,train\_time\_g,train\_time\_r100,train\_time_knn\] 从上图可以明显看出与其他模型相比Adaboost和XGboost花费的时间少得多而其他模型由于SVC花费了最多的时间原因可能是我们已经将一些关键参数传递给了SVC。 步骤9.模型优化 在每个迭代次数上随机搜索的性能均优于网格搜索。同样随机搜索似乎比网格搜索更快地收敛到最佳状态这意味着迭代次数更少的随机搜索与迭代次数更多的网格搜索相当。 在高维参数空间中由于点变得更稀疏因此在相同的迭代中网格搜索的性能会下降。同样常见的是超参数之一对于找到最佳超参数并不重要在这种情况下网格搜索浪费了很多迭代而随机搜索却没有浪费任何迭代。 现在我们将使用Randomsearch cv优化模型准确性。如上表所示Adaboost在该数据集中表现最佳。因此我们将尝试通过微调adaboost和SVC的超参数来进一步优化它们。 参数调整 现在让我们看看adaboost的最佳参数是什么 random\_search.best\_params_{random\_state: 47, n\_estimators: 50, learning_rate: 0.01} random\_search.best\_params_{n\_estimators: 50, min\_child\_weight: 4, max\_depth: 3} random\_search.best\_params_{penalty: l2, n\_jobs: -1, n\_iter: 1000, loss: log, alpha: 0.0001} 出色的所有指标参数准确性F1分数精度ROC三个模型adaboostXGBoost和SGD的召回率现已优化。此外我们还可以尝试使用其他参数组合来查看是否会有进一步的改进。 ROC曲线图 auc  metrics.roc\_auc\_score(y\_test,model.predict(X\_test_scaled))plt.plot(\[0, 1\], \[0, 1\],r--) # 计算测试集分数的平均值和标准差test\_mean np.mean# 绘制训练集和测试集的平均准确度得分plt.plot# 绘制训练集和测试集的准确度。plt.fill\_between 验证曲线的解释 如果树的数量在10左右则该模型存在高偏差。两个分数非常接近但是两个分数都离可接受的水平太远因此我认为这是一个高度偏见的问题。换句话说该模型不适合。 在最大树数为250的情况下由于训练得分为0.82但验证得分约为0.81因此模型存在高方差。换句话说模型过度拟合。同样数据点显示出一种优美的曲线。但是我们的模型使用非常复杂的曲线来尽可能接近每个数据点。因此具有高方差的模型具有非常低的偏差因为它几乎没有假设数据。实际上它对数据的适应性太大。 从曲线中可以看出大约30到40的最大树可以最好地概括看不见的数据。随着最大树的增加偏差变小方差变大。我们应该保持两者之间的平衡。在30到40棵树的数量之后训练得分就开始上升而验证得分开始下降因此我开始遭受过度拟合的困扰。因此这是为什么30至40之间的任何数量的树都是一个不错的选择的原因。 结论 因此我们已经看到调整后的Adaboost的准确性约为82.95并且在所有其他性能指标例如F1分数PrecisionROC和Recall中也取得了不错的成绩。 此外我们还可以通过使用Randomsearch或Gridsearch进行模型优化以找到合适的参数以提高模型的准确性。 我认为如果对这三个模型进行了适当的调整它们的性能都会更好。 R语言基于决策树的银行信贷风险预警模型 |附数据代码 我国经济高速发展个人信贷业务也随着快速发展而个人信贷业务对提高内需促进消费也有拉动作用。有正必有反在个人信贷业务规模不断扩大的同时信贷的违约等风险问题也日益突出一定程度上制约着我国的信贷市场的健康发展。 挑战 近年来个人消费贷款的类型呈现出多元化的变化与发展由原本的单一贷款种类发展到今天各式各样的贷款种类汽车按揭贷款教育助学贷款耐用消费品贷款家电电脑厨具等结婚贷款等在我国陆续开展。违约风险是指债务人由于各种原因不能按时归还贷款债务的风险对于商业银行来说违约风险主要是指由于贷款人得还款能力下降或者信用水平降低从而违约。 理论相关概述 决策树  决策树Decision Tree是用于分类和预测的主要技术它着眼于从一组无规则的事例推理出决策树表示形式的分类规则采用自顶向下的递归方式在决策树的内部节点进行属性值的比较并根据不同属性判断从该节点向下分支在决策树的叶节点得到结论。因此从根节点到叶节点就对应着一条合理规则整棵树就对应着一组表达式规则。决策树是数据分析中一种经常要用到且非常重要的技术既能够用于数据分析也能够作预测。基于决策树算法的一个最大的优点是它在学习过程中不需要使用者了解很多背景知识只要训练事例能够用属性即结论的方式表达出来就能使用该算法进行学习。 基于决策树的分类模型有如下几个特点1决策树方法结构简单,,便于理解;2决策树模型效率高对训练集数据量较大的情况较为适合;3树方法通常不需要接受训练集数据外的知识;4决策树方法具有较高的分类精确度。 预警方案设计 数据在进行操作的过程中我们一共分了四步分别是数据分析和分离数据集建立训练数据集决策树评估模型性能提高模型性能。 数据分析和分离数据集 在数据进行分析时可以从中知道所有申请者的违约情况在分离数据集这一步我们将数据分成两部分用来建立决策树训练数据集和用来评估模型性能的测试数据集按照80训练集和20测试集来分离样本。总的来看这两个数据集的比例是大致相同的所以分离的两个数据集是合理的。 建立训练数据集决策树 图1 图1是训练数据集决策树的基本情况。 图2 图2是训练数据集的部分决策树。 由于我们我们的数据庞大生成的决策树非常的大上图的输出显示了决策树的部分分枝我们用简单的语言来举例解释前五行 1如果支票账户余额是未知的则归类为不太可能违约。 2否则如果支票账户余额少于0或者1〜200之间; 3月贷款期限少于或等于11个月的 4信用记录是危及好的优秀的差的归类为不太可能违约。 5信用记录是非常优秀的就归类为很有可能违约。 括号中的数字表示符合该决策准则的案例的数量以及根据该决策不正确分类的案例的数量。 在决策树中我们不难发现为什么一个申请者的信用记录非常优秀却被判成很有可能违约而那些支票余额未知的申请者却不太可能违约呢这些决策看似没有逻辑意义但其实它们可能反映了数据中的一个真实模式或者它们可能是统计中的异常值。 在决策树生成后输出一个混淆矩阵这是一个交叉列表表示模型对训练数据错误分类的记录数 众所周知决策树有一种过度拟合训练数据模型的倾向由于这个原因训练数据中报告的错误率可能过于乐观因此基于测试数据集来评估决策树模型是非常重要的。 评估模型性能 在这一步中使用测试数据集做预测。 可以得知在测试集样本中实际不违约被判为不违约的数量占比为0.625;实际不违约被判为违约的数量占比为0.140;而实际违约被判为不违约的数量占比为0.115;实际违约被判为违约的数量占比为0.120。 从银行角度出发申请人实际不违约被判为违约的影响远没有实际违约被判为不违约的影响大。原因有以下几点一申请人实际不违约被判为违约银行可能不会通过贷款申请从而不发放贷款这样银行不会遭受贷款发放出去却收不回来的风险只是少收部分贷款利息而已。二申请人实际违约被判为不违约银行可能会同意申请人的贷款申请同意发放贷款在发放贷款后被判为不违约的申请人可能会因为缺乏诚信不遵守合约规定按时还款这样银行不仅损失了利息的收入连本金都有可能收不回来三在测试数据集数据中实际不违约的数量占比0.183;而实际违约的数量被判为不违约的数量占比0.489。 由以上三点可以得出结论基于训练测试集得出的模型用测试数据集中的数据进行检验最终出来的结果并不是很好。从银行角度出发如果使用该模型引用到实际生活中会因为申请人实际违约被误判为不违约的概率太大而使银行做出错误的决定从而产生损失。 模型优化方案 - 增加迭代次数代价矩阵 由上面的评估模型性能可以得知基于训练数据集得出的模型不太理想因此我们来提高模型的性能。 1迭代10次 首先我们选择使用迭代10次的方法进行对模型性能的提高。 3可以知道经过10次迭代实际违约被判为不违约的数量占比0.115与训练数据集的模型相比没有变化;而实际不违约被判为违约的数量占比0.100。 从银行角度出发这次的模型性能提高没有很大的实际意义因为影响银行是否亏损的最主要因素是看实际违约被判为不违约的比重而这次的性能提高并没有减少实际违约被判为不违约的数量所以我们还要继续提高模型的性能。 2迭代100次 根据上面的步骤知道迭代10次出来的模型效果并不是很好所以我们在这一步进行迭代100次的操作。 经过迭代100次的过程出来的结果由表4所示与训练数据集的结果图相比由此可以看出该次模型性能的提升没有较大效果。 3代价矩阵 由于上述两次操作均没有使得模型的性能得到较大的提升所以在这一步我们决定采用代价矩阵的方式来进行。 这里我们假设将一个违约用户错误的分类为不违约相比于将不违约用户错误的分类为违约来说前者相较于后者会给贷款方造成4倍的损失故代价矩阵为 上述矩阵行表示真实值列表示预测值第一列和第一行代表不违约第二列和第二行代表违约。假如该算法正确分类时则没有分配代价。图6是加入代价矩阵的模型分类结果汇总。 相较于前面的结果在加入代价矩阵后的模型效果不错在实际违约被判为不违约的比例上得到了较大程度的下降。 图3 图3是测试数据集的部分决策树。 建议 现今我国的生活水平逐步提升个人的消费水平也跟着上升但仍有很多人的工资薪酬涨幅跟不上消费的增长就会从商业银行贷款作为经济生活维持已提升自己的生活水平不仅是车辆按揭贷房产按揭贷款教育助学贷款耐用消费品贷款结婚贷款等在我国陆续开展数量与规模也越来越庞大。商业银行要从贷款中获利就必须加强对于贷款的风险管理在进行单一评估的同时从大量规律中获取经验对于人力无法理解的大规模数据就需相关研究来获取有用的规律帮助商业银行及其他金融机构做出决策而决策树对银行及金融机构来说就是一种很好的决策管理方法。 通过决策树的每一个子节点可以看出哪一个自变量会对贷款违约有多大的影响从而商业银行可以更加的关注客户的这一方面在这方面严格把关。算法能够为影响较大的错误分类进行误判代价值的设定从而使模型在这类误判中的增加重视降低这类错误发生的概率。假设银行将实际上不违约的客户判成了违约银行仅仅是少获得几笔贷款的利息不至于把整笔贷款都亏掉变成坏账;但假如银行使用了这种算法对客户的违约可能性做出更为准确的判断便能减少银行对实际违约的客户错判成不违约的情况降低银行出现贷款无法追收的情况。  关于分析师   在此对 Fanghui Shao 对本文所作的贡献表示诚挚感谢他在卡耐基梅隆大学完成了数理金融专业的硕士学位专注量化金融、数据分析、统计分析领域。擅长 Python、R 语言、Excel。 资料获取 在公众号后台回复“领资料”可免费获取数据分析、机器学习、深度学习等学习资料。 本文中分析的数据、代码分享到会员群扫描下面二维码即可加群  点击文末“阅读原文” 获取全文完整代码数据资料。 本文选自《银行信贷风控专题Python、R 语言机器学习数据挖掘实例合集xgboost、决策树、随机森林、贝叶斯等》。 点击标题查阅往期内容 数据分享|Python决策树、随机森林、朴素贝叶斯、KNNK-最近邻居分类分析银行拉新活动挖掘潜在贷款客户 PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享 用PyTorch机器学习神经网络分类预测银行客户流失模型 R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测4个案例 Python中TensorFlow的长短期记忆神经网络(LSTM)、指数移动平均法预测股票市场和可视化 R语言KERAS用RNN、双向RNNS递归神经网络、LSTM分析预测温度时间序列、 IMDB电影评分情感 Python用Keras神经网络序列模型回归拟合预测、准确度检查和结果可视化 Python用LSTM长短期记忆神经网络对不稳定降雨量时间序列进行预测分析 R语言中的神经网络预测时间序列多层感知器MLP和极限学习机ELM数据分析报告 R语言深度学习用keras神经网络回归模型预测时间序列数据 Matlab用深度学习长短期记忆LSTM神经网络对文本数据进行分类 R语言KERAS深度学习CNN卷积神经网络分类识别手写数字图像数据MNIST MATLAB中用BP神经网络预测人体脂肪百分比数据 Python中用PyTorch机器学习神经网络分类预测银行客户流失模型 R语言实现CNN卷积神经网络模型进行回归数据分析 Python使用神经网络进行简单文本分类 R语言用神经网络改进Nelson-Siegel模型拟合收益率曲线分析 R语言基于递归神经网络RNN的温度时间序列预测 R语言神经网络模型预测车辆数量时间序列 R语言中的BP神经网络模型分析学生成绩 matlab使用长短期记忆LSTM神经网络对序列数据进行分类 R语言实现拟合神经网络预测和结果可视化 用R语言实现神经网络预测股票实例 使用PYTHON中KERAS的LSTM递归神经网络进行时间序列预测 python用于NLP的seq2seq模型实例:用Keras实现神经网络机器翻译 用于NLP的Python使用Keras的多标签文本LSTM神经网络分类
http://www.dnsts.com.cn/news/140981.html

相关文章:

  • 旅游网站建设的目标上海闵行有阳性了
  • 海珠定制型网站建设东莞做购物网站
  • 营销型网站北京众筹网站建设公司
  • 蓝色旅游网站模板企业logo设计说明
  • 网站团队人员233小游戏
  • 丹东网站开发android官网
  • 宣传部网站建设方案那家财经网站做的好
  • 兰州企业网站深圳有几个区分布图
  • php网页游戏源码如何优化网站打开速度
  • 期货交易网站开发企业网络营销信息源类别及传递渠道调查
  • 中小型网站有哪些黑帽seo易下拉霸屏
  • 昆明网站建设SEO公司昆明网站建设天猫运营
  • 淮南做网站的公司威联通WordPress
  • 网站优化方案设计wordpress wp rest api
  • wordpress网站搭建教程视频网站建设包括哪些
  • 企业网站建设 论文白杨seo教程
  • 企业网站建设的优缺点太原百度关键词推广
  • 如何在网站标题加logo网站的英文版怎么做的
  • 企业建设网站公司免费logo设计网址
  • 微商网站怎么做的图书网站怎么做
  • 个人网站可以挂广告吗网站开发需要英语
  • dede网站地图制作seo在线教程
  • 轻松建立网站制作简易网站模板
  • 网站不被搜索引擎收录吗wordpress必备
  • 如何做网站demo湘潭网站建设 磐石网络实惠
  • 南京网站a建设云世家东莞百度网站推广
  • 群晖可以做几个网站西安网站建设公司排
  • 电商法规定企业网站必须做3年wordpress cache 插件
  • 做东西的网站有那些建站好的公司
  • 做好系部宣传和网站建设响应式网站免费模板下载