当前位置：首页 > news >正文

ui最好的网站wordpress 国际化

news 2026/2/26 15:25:45

ui最好的网站,wordpress 国际化,省住房和城乡建设厅网站,学校的网站管理系统一、评估方法留出法#xff08;Holdout Method#xff09;#xff1a; 将数据集划分为训练集和测试集两部分#xff0c;通常按照一定比例#xff08;如 70% 训练集#xff0c;30% 测试集#xff09;。训练集用于训练模型#xff0c;测试集用于评估模型性能。优点Holdout Method 将数据集划分为训练集和测试集两部分通常按照一定比例如 70% 训练集30% 测试集。训练集用于训练模型测试集用于评估模型性能。优点简单易行。缺点结果依赖于数据集的划分方式不同的划分可能导致不同的评估结果。交叉验证法Cross Validation 最常见的是 k 折交叉验证。将数据集分成 k 个大小相似的互斥子集每次用 k-1 个子集作为训练集余下的一个作为测试集进行 k 次训练和测试最终将 k 次的结果取平均值。优点能更充分利用数据结果相对稳定能降低因数据划分导致的偏差。缺点计算开销较大尤其是对于大数据集和复杂模型。例如5 折交叉验证就是将数据集分成 5 份每次取 4 份训练1 份测试重复 5 次。自助法Bootstrap Method 从原始数据集中有放回地抽样产生多个新的训练集每次抽样得到的样本作为一个训练集未被抽到的样本作为测试集。优点在数据集较小、难以有效划分训练集和测试集时很有用。缺点改变了初始数据集的分布会引入一定的偏差。二、性能度量分类问题的性能度量准确率Accuracy预测正确的样本数占总样本数的比例公式为 Accuracy (TP TN) / (TP TN FP FN)其中 TP 是真正例TN 是真反例FP 是假正例FN 是假反例。精确率Precision预测为正例的样本中真正例的比例公式为 Precision TP / (TP FP)。召回率Recall真正例中被预测为正例的比例公式为 Recall TP / (TP FN)。F1 分数精确率和召回率的调和平均值公式为 F1 2 * (Precision * Recall) / (Precision Recall)。ROC 曲线和 AUC 值 ROC 曲线以假正例率FPR为横坐标真正例率TPR为纵坐标绘制通过调整分类阈值得到不同的点连成曲线。AUC 值是 ROC 曲线下的面积范围在 0 到 1 之间值越大表示模型性能越好。回归问题的性能度量均方误差MSE预测值与真实值差的平方的平均值公式为 MSE (1/n) * Σ(y - y_pred)^2其中 y 是真实值y_pred 是预测值。平均绝对误差MAE预测值与真实值差的绝对值的平均值公式为 MAE (1/n) * Σ|y - y_pred|。均方根误差RMSEMSE 的平方根对较大误差更敏感公式为 RMSE sqrt(MSE)。三、比较检验假设检验用于比较不同模型性能差异是否显著。例如使用 t 检验或 McNemar 检验。t 检验通常用于比较两个模型在同一数据集上的性能是否有显著差异基于样本均值和标准差。McNemar 检验用于比较两种分类算法在同一测试集上的差异主要关注两种算法的分类结果不一致的部分。交叉验证 t 检验结合了交叉验证和 t 检验用于比较多个模型的性能。对于两个模型分别进行多次交叉验证得到多个性能度量然后对这些度量进行 t 检验以判断它们是否有显著差异。四、偏差与方差偏差Bias 反映了模型预测值与真实值的期望之间的差异描述了模型的准确性。高偏差意味着模型过于简单可能导致欠拟合不能很好地拟合训练数据也不能很好地泛化到新数据。方差Variance 反映了模型在不同训练集上的预测值的变化程度描述了模型的稳定性。高方差意味着模型对训练数据的微小变化非常敏感可能导致过拟合在训练集上表现好但在新数据上表现差。偏差-方差权衡模型的泛化误差可以分解为偏差、方差和噪声。通常简单模型偏差大、方差小复杂模型偏差小、方差大需要找到一个平衡使泛化误差最小。公式一、分类问题的性能度量公式准确率Accuracy 公式 Accuracy T P T N T P T N F P F N \text{Accuracy} \frac{TP TN}{TP TN FP FN} AccuracyTPTNFPFNTPTN解释 T P TP TPTrue Positive真正例即实际为正类且被预测为正类的样本数量。 T N TN TNTrue Negative真反例即实际为反类且被预测为反类的样本数量。 F P FP FPFalse Positive假正例即实际为反类但被预测为正类的样本数量。 F N FN FNFalse Negative假反例即实际为正类但被预测为反类的样本数量。该公式计算的是预测正确的样本数包括正确预测为正类和正确预测为反类在总样本数中的占比反映了模型预测的整体准确性。精确率Precision 公式 Precision T P T P F P \text{Precision} \frac{TP}{TP FP} PrecisionTPFPTP解释它衡量的是在所有被预测为正类的样本中真正为正类的样本所占的比例。精确率高表示在预测为正类的样本中误判为正类的情况较少侧重于预测结果为正类的准确性。召回率Recall 公式 Recall T P T P F N \text{Recall} \frac{TP}{TP FN} RecallTPFNTP解释召回率表示在所有实际为正类的样本中被正确预测为正类的样本所占的比例。召回率高表示实际正类被模型成功找出的比例高侧重于对正类的查全能力避免遗漏正类样本。 F1 分数F1 Score 公式 F1 2 × Precision × Recall Precision Recall \text{F1} 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} \text{Recall}} F12×PrecisionRecallPrecision×Recall解释 F1 分数是精确率和召回率的调和平均值是一个综合考虑精确率和召回率的指标用于平衡精确率和召回率之间的关系。当精确率和召回率都很高时F1 分数会比较高避免了单独考虑精确率或召回率的片面性。 ROC 曲线和 AUC 值 ROC 曲线Receiver Operating Characteristic Curve 绘制方式通过调整分类器的阈值得到一系列的真阳性率 T P R TPR TPR和假阳性率 F P R FPR FPR以 F P R FPR FPR 为横坐标 T P R TPR TPR 为纵坐标绘制曲线。 T P R T P T P F N TPR \frac{TP}{TP FN} TPRTPFNTP表示在所有实际正类中被正确预测为正类的比例。 F P R F P T N F P FPR \frac{FP}{TN FP} FPRTNFPFP表示在所有实际反类中被错误预测为正类的比例。 AUC 值Area Under the Curve 解释是 ROC 曲线下的面积范围在 0 到 1 之间。AUC 值越大说明分类器在不同阈值下的性能越好能够更好地区分正类和反类当 AUC 1 时表示完美分类器AUC 0.5 表示随机分类器。二、回归问题的性能度量公式均方误差MSE - Mean Squared Error 公式 MSE 1 n ∑ i 1 n ( y i − y ^ i ) 2 \text{MSE} \frac{1}{n} \sum_{i1}^{n} (y_i - \hat{y}_i)^2 MSEn1∑i1n(yi−y^i)2解释 y i y_i yi 是第 i i i 个样本的真实值 y ^ i \hat{y}_i y^i 是第 i i i 个样本的预测值 n n n 是样本数量。MSE 计算的是预测值与真实值差的平方的平均值对较大误差的惩罚较大因为误差是平方项会放大较大误差的影响常用于评估回归模型的性能。平均绝对误差MAE - Mean Absolute Error 公式 MAE 1 n ∑ i 1 n ∣ y i − y ^ i ∣ \text{MAE} \frac{1}{n} \sum_{i1}^{n} |y_i - \hat{y}_i| MAEn1∑i1n∣yi−y^i∣解释计算预测值与真实值差的绝对值的平均值对所有误差同等对待不像 MSE 那样对大误差进行平方放大更直观地反映了预测误差的平均大小。均方根误差RMSE - Root Mean Squared Error 公式 RMSE MSE \text{RMSE} \sqrt{\text{MSE}} RMSEMSE 解释是 MSE 的平方根它与预测值和真实值具有相同的量纲使得结果更具解释性例如在预测房价时RMSE 的单位与房价的单位相同。三、假设检验公式以 t 检验为例 t 检验公式 t X 1 ˉ − X 2 ˉ s p 1 n 1 1 n 2 t \frac{\bar{X_1} - \bar{X_2}}{s_p \sqrt{\frac{1}{n_1} \frac{1}{n_2}}} tspn11n21 X1ˉ−X2ˉ解释 X 1 ˉ \bar{X_1} X1ˉ 和 X 2 ˉ \bar{X_2} X2ˉ 是两个样本的均值 n 1 n_1 n1 和 n 2 n_2 n2 是两个样本的大小。 s p s_p sp 是合并标准差公式为 s p ( n 1 − 1 ) s 1 2 ( n 2 − 1 ) s 2 2 n 1 n 2 − 2 s_p \sqrt{\frac{(n_1 - 1)s_1^2 (n_2 - 1)s_2^2}{n_1 n_2 - 2}} spn1n2−2(n1−1)s12(n2−1)s22 其中 s 1 2 s_1^2 s12 和 s 2 2 s_2^2 s22 是两个样本的方差。t 检验用于检验两个样本的均值是否有显著差异根据计算得到的 t 值和自由度查 t 分布表可得到对应的 p 值若 p 值小于显著性水平如 0.05则认为两个样本的均值有显著差异。四、偏差与方差公式在平方损失下偏差Bias 对于一个模型 f ( x ) f(x) f(x)假设真实的数据生成函数是 y g ( x ) ϵ y g(x) \epsilon yg(x)ϵ偏差的期望定义为 Bias ( f ^ ( x ) ) E [ f ^ ( x ) ] − g ( x ) \text{Bias}(\hat{f}(x)) E[\hat{f}(x)] - g(x) Bias(f^(x))E[f^(x)]−g(x)解释偏差反映了模型预测的期望与真实值的差距衡量了模型对数据的拟合能力高偏差可能导致欠拟合即模型过于简单无法很好地拟合训练数据和潜在的数据模式。方差Variance 对于一个模型 f ( x ) f(x) f(x)方差定义为 Variance ( f ^ ( x ) ) E [ ( f ^ ( x ) − E [ f ^ ( x ) ] ) 2 ] \text{Variance}(\hat{f}(x)) E[(\hat{f}(x) - E[\hat{f}(x)])^2] Variance(f^(x))E[(f^(x)−E[f^(x)])2]解释方差反映了模型在不同训练集上预测结果的波动情况高方差可能导致过拟合即模型对训练数据过于敏感在不同训练集上会产生较大的预测差异。这些公式在评估机器学习模型的性能、比较不同模型以及分析模型的拟合能力等方面都起着至关重要的作用你可以根据具体的问题和数据类型选择合适的评估指标和检验方法使用相应的公式进行计算和分析。 Python 的 numpy 库来进行向量和矩阵的操作以方便计算上述公式中的求和、平方、绝对值等操作。计算 MSE 的 Python 代码如下 import numpy as npdef mse(y_true, y_pred):return np.mean((y_true - y_pred) ** 2)# 示例使用 y_true np.array([1, 2, 3, 4, 5]) y_pred np.array([1.2, 2.1, 2.8, 4.2, 5.1]) print(mse(y_true, y_pred))代码解释导入 numpy 库使用 numpy 的 array 存储真实值和预测值。定义 mse 函数使用 numpy 的 mean 函数计算差值的平方的平均值。最后给出一个示例调用函数计算并输出 MSE 值。五、代码示例Python 实现 from sklearn.model_selection import train_test_split, cross_val_score from sklearn.datasets import load_iris from sklearn.linear_model import LogisticRegression# 加载鸢尾花数据集 iris load_iris() X iris.data y iris.target# 留出法示例 X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.3, random_state42) model LogisticRegression() model.fit(X_train, y_train) accuracy model.score(X_test, y_test) print(fHoldout Method Accuracy: {accuracy})# 交叉验证示例 model LogisticRegression() cv_scores cross_val_score(model, X, y, cv5) print(fCross Validation Scores: {cv_scores}) print(fCross Validation Mean Accuracy: {cv_scores.mean()})# 性能度量示例使用混淆矩阵计算精确率、召回率和 F1 分数 from sklearn.metrics import confusion_matrix, precision_score, recall_score, f1_score y_pred model.predict(X_test) cm confusion_matrix(y_test, y_pred) precision precision_score(y_test, y_pred, averagemacro) recall recall_score(y_test, y_pred, averagemacro) f1 f1_score(y_test, y_pred, averagemacro) print(fConfusion Matrix:\n{cm}) print(fPrecision: {precision}) print(fRecall: {recall}) print(fF1 Score: {f1})# 比较检验示例这里简单对比两个不同参数的逻辑回归模型 model1 LogisticRegression(C1.0) model2 LogisticRegression(C0.1) cv_scores1 cross_val_score(model1, X, y, cv5) cv_scores2 cross_val_score(model2, X, y, cv5) from scipy.stats import ttest_ind t_stat, p_value ttest_ind(cv_scores1, cv_scores2) print(fT-Test Statistic: {t_stat}, P-Value: {p_value})# 偏差与方差示例这里仅为概念说明实际需要多次实验 def train_and_predict(X_train, y_train, X_test):model LogisticRegression()model.fit(X_train, y_train)return model.predict(X_test)# 多次实验观察结果的变化可判断方差 results [] for i in range(10):X_train, _, y_train, _ train_test_split(X, y, test_size0.3, random_statei)y_pred train_and_predict(X_train, y_train, X_test)results.append(y_pred)代码解释留出法使用 train_test_split 从 iris 数据集中划分出训练集和测试集。创建 LogisticRegression 模型在训练集上训练并在测试集上评估准确率。交叉验证直接使用 cross_val_score 进行 5 折交叉验证得到 5 次验证的准确率得分取平均值。性能度量使用 confusion_matrix 计算混淆矩阵进而计算精确率、召回率和 F1 分数。比较检验创建两个不同参数的 LogisticRegression 模型使用 cross_val_score 得到它们的交叉验证得分。使用 ttest_ind 进行 t 检验得到 t 统计量和 p 值根据 p 值判断差异是否显著。偏差与方差定义 train_and_predict 函数进行训练和预测。多次不同划分进行实验观察结果的变化可定性分析方差。通过上述评估方法、性能度量、比较检验和对偏差与方差的理解你可以更好地评估和选择机器学习模型使模型在训练和测试中取得更好的性能并能有效地比较不同模型的优劣。阅读代码时注意 sklearn 中函数的参数设置如 train_test_split 的 test_size 决定了测试集比例cross_val_score 的 cv 表示交叉验证的折数。。

查看全文

http://www.dnsts.com.cn/news/238128.html