@geekpi
https://linux.cn/article-14607-1.html
This commit is contained in:
Xingyu Wang 2022-05-18 15:10:47 +08:00
parent 413e010ee1
commit b861fb953c

View File

@ -3,17 +3,18 @@
[#]: author: "S Ratan Kumar https://www.opensourceforu.com/author/s-ratan/"
[#]: collector: "lkxed"
[#]: translator: "geekpi"
[#]: reviewer: " "
[#]: publisher: " "
[#]: url: " "
[#]: reviewer: "wxy"
[#]: publisher: "wxy"
[#]: url: "https://linux.cn/article-14607-1.html"
PyCaret机器学习模型开发变得简单
======
在当今快节奏的数字世界中,组织使用低代码/无代码 (LC/NC) 应用来快速构建新的信息系统。本文介绍 PyCaret一个用 Python 编写的低代码机器学习库。
> 在当今快节奏的数字世界中,机构们使用低代码/无代码LC/NC应用来快速构建新的信息系统。本文将介绍 PyCaret这是一个用 Python 编写的低代码机器学习库。
![Featured-image-of-pycaret][1]
PyCaret 是 R 编程语言中 Caret分类和回归训练的缩写包的 Python 版本,具有许多优点。
PyCaret 是 R 编程语言中 Caret<ruby>分类和回归训练<rt>Classification And REgression Training</rt></ruby>的缩写)包的 Python 版本,具有许多优点。
- **提高工作效率:** PyCaret 是一个低代码库,可让你提高工作效率。由于花费更少的时间进行编码,你和你的团队现在可以专注于业务问题。
- **易于使用:** 这个简单易用的机器学习库将帮助你以更少的代码行执行端到端的机器学习实验。
@ -35,7 +36,7 @@ pip install pycaret [full]
#### 步骤 1
首先,通过给出以下命令安装 PyCaret
首先,通过给出以下命令安装 PyCaret
```
pip install pycaret
@ -49,10 +50,10 @@ pip install pycaret
```
from pycaret.datasets import get_data
dataset = get_data(iris) 
(or)
dataset = get_data('iris') 
(或者)
import pandas as pd
dataset = pd.read_csv(/path_to_data/file.csv)
dataset = pd.read_csv('/path_to_data/file.csv')
```
#### 步骤 3
@ -63,12 +64,12 @@ dataset = pd.read_csv(/path_to_data/file.csv)
```
from pycaret.classification import *
clf1 = setup (data=dataset, target = species)
clf1 = setup(data=dataset, target = species)
```
![PyCaret environment setup result][4]
对于使用 PyCaret 构建任何类型的模型,环境设置是最重要的一步。默认情况下,*setup()* 函数采用 *data*: Pandas DataFrame 和 target它指向数据集中的类标签变量。 setup 函数的结果如图 3 所示。 setup 函数默认将 70% 的数据拆分为训练集30% 作为测试集,并进行数据预处理,如图 3 所示。
使用 PyCaret 构建任何类型的模型,环境设置是最重要的一步。默认情况下,`setup()` 函数接受参数 `data`Pandas 数据帧)和 `target`(指向数据集中的类标签变量)。`setup()` 函数的结果如图 3 所示。 `setup()` 函数默认将 70% 的数据拆分为训练集30% 作为测试集,并进行数据预处理,如图 3 所示。
#### 步骤 4
@ -80,7 +81,7 @@ clf1 = setup (data=dataset, target = species)
best = compare_models()
```
默认情况下,*compare_models()* 应用十倍交叉验证并针对具有较少训练时间的不同分类器计算不同的性能指标如准确度、AUC、召回率、精度、F1 分数、Kappa 和 MCC如图 4 所示。通过将 tubro=True 传递给 *compare_models()* 函数,我们可以尝试所有分类器。
默认情况下,`compare_models()` 应用十倍交叉验证并针对具有较少训练时间的不同分类器计算不同的性能指标如准确度、AUC、召回率、精度、F1 分数、Kappa 和 MCC如图 4 所示。通过将 `tubro=True` 传递给 `compare_models()` 函数,我们可以尝试所有分类器。
#### 步骤 5
@ -92,7 +93,7 @@ best = compare_models()
lda_model=create_model (lda)
```
线性判别分析分类器表现良好,如图 4 所示。因此,通过将 “lda” 传递给 *create_model()* 函数,我们可以拟合模型。
线性判别分析分类器表现良好,如图 4 所示。因此,通过将 `lda` 传递给 `create_model()` 函数,我们可以拟合模型。
#### 步骤 6
@ -104,7 +105,7 @@ lda_model=create_model (lda)
tuned_lda=tune_model(lda_model)
```
超参数的调整可以提高模型的准确性。 *tune_model()* 函数将线性判别分析模型的精度从 0.9818 提高到 0.9909,如图 7 所示。
超参数的调整可以提高模型的准确性。`tune_model()` 函数将线性判别分析模型的精度从 0.9818 提高到 0.9909,如图 7 所示。
![Tuned model details][8]
@ -118,7 +119,7 @@ tuned_lda=tune_model(lda_model)
predictions=predict_model(tuned_lda)
```
*predict_model()* 函数用于对测试数据中存在的样本进行预测。
`predict_model()` 函数用于对测试数据中存在的样本进行预测。
#### 步骤 8
@ -130,7 +131,7 @@ predictions=predict_model(tuned_lda)
evaluate_model(tuned_lda)
```
*evaluate_model ()* 函数用于以最小的努力开发不同的性能指标。你可以尝试它们并查看输出。
`evaluate_model()` 函数用于以最小的努力开发不同的性能指标。你可以尝试它们并查看输出。
--------------------------------------------------------------------------------
@ -139,7 +140,7 @@ via: https://www.opensourceforu.com/2022/05/pycaret-machine-learning-model-devel
作者:[S Ratan Kumar][a]
选题:[lkxed][b]
译者:[geekpi](https://github.com/geekpi)
校对:[校对者ID](https://github.com/校对者ID)
校对:[wxy](https://github.com/wxy)
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出