Metadata-Version: 2.1
Name: deepepochs
Version: 0.4.13
Summary: An easy-to-use tool for training Pytorch deep learning models
Home-page: https://github.com/hitlic/deepepochs
Author: hitlic
Author-email: liuchen.lic@gmail.com
License: MIT
Classifier: Development Status :: 3 - Alpha
Classifier: Programming Language :: Python :: 3
Classifier: License :: OSI Approved :: MIT License
Classifier: Operating System :: OS Independent
Requires-Python: >=3.8
Description-Content-Type: text/markdown
License-File: LICENSE

# DeepEpochs

Pytorch深度学习模型训练工具。

### 安装

```bash
pip install deepepochs
```

### 使用

#### 数据要求

- 训练集、验证集和测试集是`torch.utils.data.Dataloader`对象
- `Dataloaer`所构造的每个mini-batch数据（`collate_fn`返回值）是一个`tuple`或`list`，其中最后一个是标签
  - 如果训练中不需要标签，则需将最后一项置为`None`

#### 指标计算

- 每个指标是一个函数
  - 有两个参数，分别为模型预测和数据标签
  - 返回值为当前mini-batch上的指标值

#### 应用

```python
from deepepochs import Trainer, CheckCallback, rename, EpochTask, LogCallback
import torch
from torch import nn
from torch.nn import functional as F
from torchvision.datasets import MNIST
from torchvision import transforms
from torch.utils.data import DataLoader, random_split
from torchmetrics import functional as MF

# datasets
data_dir = './datasets'
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))])
mnist_full = MNIST(data_dir, train=True, transform=transform, download=True)
train_ds, val_ds, _ = random_split(mnist_full, [5000, 5000, 50000])
test_ds = MNIST(data_dir, train=False, transform=transform, download=True)

# dataloaders
train_dl = DataLoader(train_ds, batch_size=32)
val_dl = DataLoader(val_ds, batch_size=32)
test_dl = DataLoader(test_ds, batch_size=32)

# pytorch model
channels, width, height = (1, 28, 28)
model = nn.Sequential(
    nn.Flatten(),
    nn.Linear(channels * width * height, 64),
    nn.ReLU(),
    nn.Dropout(0.1),
    nn.Linear(64, 64),
    nn.ReLU(),
    nn.Dropout(0.1),
    nn.Linear(64, 10)
)

def acc(preds, targets):
    return MF.accuracy(preds, targets, task='multiclass', num_classes=10)

@rename('')
def multi_metrics(preds, targets):
    return {
        'p': MF.precision(preds, targets, task='multiclass', num_classes=10),
        'r': MF.recall(preds, targets, task='multiclass', num_classes=10)
        }
checker = CheckCallback('loss', on_stage='val', mode='min', patience=2)
opt = torch.optim.Adam(model.parameters(), lr=2e-4)

trainer = Trainer(model, F.cross_entropy, opt=opt, epochs=5, callbacks=checker, metrics=[acc])

progress = trainer.fit(train_dl, val_dl, metrics=[multi_metrics])
test_rst = trainer.test(test_dl)
```

### 示例

|序号|功能说明|代码|
| ---- | ---- | ---- |
|1|基本使用|`examples/1-basic.py`|
|2|训练器、fit方法、test方法的常用参数|`examples/2-basic-params.py`|
|3|模型性能评价指标的使用|`examples/3-metrics.py`|
|4|Checkpoint和EarlyStop|`examples/4-checkpoint-earlystop.py`|
|5|检测适当的学习率|`examples/5-lr-find.py`|
|6|利用Tensorboad记录训练过程|`examples/6-logger.py`|
|7|利用tensorboard记录与可视化超参数|`examples/7-log-hyperparameters.py`|
|8|分析与解释模型的预测效果|`examples/8-interprete.py`|
|9|学习率调度|`examples/9-lr-schedule.py`|
|10|使用多个优化器|`examples/10-multi-optimizers.py`|
|11|在训练、验证、测试中使用多个Dataloader|`examples/11-multi-dataloaders.py`|
|12|利用图神经网络对节点进行分类|`examples/12-node-classification.py`|
|13|模型前向输出和梯度的可视化|`examples/13-weight-grad-visualize.py`|
|14|自定义Callback|`examples/14-costomize-callback.py`|
|15|通过`TrainerBase`定制`train_step`和`evaluate_step`|`examples/15-customize-steps-1.py`|
|16|通过`EpochTask`定制`train_step`和`eval_step`和`test_step`|`examples/16-customize-steps-2.py`|
|17|通过`EpochTask`定制`*step`|`examples/17-costomize-steps-3.py`|
|18|内置Patch的使用|`examples/18-use_patches.py`|
|19|自定义Patch|`examples/19-customize-patch.py`|

### 定制训练流程

- 方法1:
    - 第1步：继承`deepepochs.Callback`类，定制满足需要的`Callback`
    - 第2步：使用`deepepochs.Trainer`训练模型，将定制的`Callback`对象作为`Trainer`的`callbacks`参数
- 方法2:
    - 第1步：继承`deepepochs.TrainerBase`类，定制满足需要的`Trainer`，实现`step`、`train_step`、`val_step`、`test_step`或`evaluate_step`方法
        - 这些方法的参数
            - `batch_x`：     一个mini-batch的模型输入数据
            - `batch_y`：     一个mini-batch的标签
            -  `**step_args`：可变参数字典，包含`do_loss`、`metrics`等参数
        - 这些方法的返回值为元组或字典
            - 元组：`(loss, model_out)`
              - 损失
              - 模型预测输出
            - 字典：`{'loss': loss_value, 'model_out': model_out}`
    - 第2步：调用定制`Trainer`训练模型。
- 方法3:
    - 第1步：继承`deepepochs.EpochTask`类，在其中定义`step`、`train_step`、`val_step`、`test_step`或`evaluate_step`方法
        - 它们的定义方式与`Trainer`中的`*step`方法相同
        - `step`方法优先级最高，即可用于训练也可用于验证和测试（定义了`step`方法，其他方法就会失效）
        - `val_step`、`test_step`优先级高于`evaluate_step`方法
        - `EpochTask`中的`*_step`方法优先级高于`Trainer`中的`*_step`方法
    - 第2步：使用新的`EpochTask`任务进行训练
        - 将`EpochTask`对象作为`Trainer.fit`中`train_tasks`和`val_tasks`的参数值，或者`Trainer.test`方法中`tasks`的参数值

### 数据流图

<img src="imgs/data_flow.png" width="80%" alt="https://github.com/hitlic/deepepochs/blob/main/imgs/data_flow.png"/>
