Update README.md
Browse files
README.md
CHANGED
|
@@ -1,9 +1,125 @@
|
|
| 1 |
---
|
| 2 |
license: mit
|
| 3 |
language:
|
| 4 |
-
- zh
|
| 5 |
-
- en
|
| 6 |
pipeline_tag: image-classification
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 7 |
---
|
| 8 |
|
| 9 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
---
|
| 2 |
license: mit
|
| 3 |
language:
|
| 4 |
+
- zh
|
| 5 |
+
- en
|
| 6 |
pipeline_tag: image-classification
|
| 7 |
+
tags:
|
| 8 |
+
- image-classification
|
| 9 |
+
- binary-classification
|
| 10 |
+
- mobilenetv3
|
| 11 |
+
- pytorch
|
| 12 |
+
- acg
|
| 13 |
+
- anime
|
| 14 |
+
- comic
|
| 15 |
+
- game
|
| 16 |
+
- computer-vision
|
| 17 |
+
|
| 18 |
+
---
|
| 19 |
+
|
| 20 |
+
# IsACG – “是否是 ACG 图像”的二分类模型系列
|
| 21 |
+
|
| 22 |
+
IsACG 是一个专注于判断图像是否为 ACG(**Anime、Comic、Game**)风格的轻量化图像分类系列模型。模型基于 **MobileNetV3-Large** 和 **MobileNetV3-Small** 构建,在保证性能的同时注重低资源占用,适用于多种部署环境。
|
| 23 |
+
|
| 24 |
+
---
|
| 25 |
+
|
| 26 |
+
## 模型架构说明
|
| 27 |
+
|
| 28 |
+
- **v1**:`mobilenet_v3_large`
|
| 29 |
+
- 参数量约为 5.5M;
|
| 30 |
+
- 更高的分类精度,适用于中端服务器或推理精度优先的场景。
|
| 31 |
+
|
| 32 |
+
- **v1s**:`mobilenet_v3_small`
|
| 33 |
+
- 参数量约为 2.5M;
|
| 34 |
+
- 更轻便、更快的推理速度,适合边缘设备、嵌入式系统和移动端部署。
|
| 35 |
+
|
| 36 |
+
- **v2**:v1s 的改进版本,融合了更广泛的数据训练和数据增强,提升泛化性;
|
| 37 |
+
- 参数量相近;
|
| 38 |
+
- 在复杂图像(如风格混合、低分辨率)上更具鲁棒性。
|
| 39 |
+
|
| 40 |
+
---
|
| 41 |
+
|
| 42 |
+
## 分类任务
|
| 43 |
+
|
| 44 |
+
- **目标标签**:二分类
|
| 45 |
+
- `"yes"`:图像为动漫、漫画或游戏相关风格;
|
| 46 |
+
- `"no"`:图像为现实照片、插画或其他非 ACG 风格。
|
| 47 |
+
|
| 48 |
+
---
|
| 49 |
+
|
| 50 |
+
## 快速使用
|
| 51 |
+
|
| 52 |
+
|
| 53 |
+
|
| 54 |
+
---
|
| 55 |
+
|
| 56 |
+
## 模型配置
|
| 57 |
+
|
| 58 |
+
默认标签配置:
|
| 59 |
+
```json
|
| 60 |
+
{
|
| 61 |
+
"0": "no",
|
| 62 |
+
"1": "yes"
|
| 63 |
+
}
|
| 64 |
+
```
|
| 65 |
+
|
| 66 |
---
|
| 67 |
|
| 68 |
+
## 模型性能对比(示例)
|
| 69 |
+
|
| 70 |
+
| 模型版本 | 架构 | Accuracy | 推理速度 (FPS) | 参数量 | 主要特点 |
|
| 71 |
+
|----------|------------------|----------|----------------|--------|----------------------------|
|
| 72 |
+
| v1 | MobileNetV3-Large | 99.1% | 35 | 5.5M | 精度高,适用于服务器环境 |
|
| 73 |
+
| v1s | MobileNetV3-Small | 98.9% | 65 | 2.5M | 轻量、快,在移动设备上表现好 |
|
| 74 |
+
| v2 | MobileNetV3-Small | 97.5% | 58 | 2.5M | 增强泛化,适用更多风格 |
|
| 75 |
+
|
| 76 |
+
---
|
| 77 |
+
|
| 78 |
+
## 数据来源与训练
|
| 79 |
+
|
| 80 |
+
- **数据集结构**:
|
| 81 |
+
- 正样本:ACG 图像(动漫截图、漫画分镜、游戏画面);
|
| 82 |
+
- 负样本:非 ACG 图像(照片、现代 UI、3D 渲染、自然风景等);
|
| 83 |
+
- **优化器**:AdamW
|
| 84 |
+
- **学习率调度**:ReduceLROnPlateau
|
| 85 |
+
- **训练框架**:PyTorch + TorchVision 库;
|
| 86 |
+
- **支持图像尺寸**:512x512 或上下文自适应填充。
|
| 87 |
+
|
| 88 |
+
---
|
| 89 |
+
|
| 90 |
+
## 示例输出
|
| 91 |
+
|
| 92 |
+
| 输入图像 | 输出类别 |
|
| 93 |
+
|----------------------|--------------|
|
| 94 |
+
| 动漫插画截图 | `"yes"` |
|
| 95 |
+
| 漫画分镜 | `"yes"` |
|
| 96 |
+
| Steam 商店游戏页面截图 | `"yes"` |
|
| 97 |
+
| 真实风景照 | `"no"` |
|
| 98 |
+
| 人物写实照片 | `"no"` |
|
| 99 |
+
| 篮球明星图像 | `"no"` |
|
| 100 |
+
|
| 101 |
+
---
|
| 102 |
+
|
| 103 |
+
## 模型适用场景
|
| 104 |
+
|
| 105 |
+
✅ ACG 图像内容识别与过滤
|
| 106 |
+
✅ 自动打标与数据筛选系统
|
| 107 |
+
✅ 风格分类器嵌入到多模态 AI 系统中
|
| 108 |
+
✅ 低资源设备(v1s/v2)快速判断
|
| 109 |
+
|
| 110 |
+
---
|
| 111 |
+
|
| 112 |
+
## 贡献与扩展
|
| 113 |
+
|
| 114 |
+
该项目遵循 MIT 协议开源,欢迎贡献和改进:
|
| 115 |
+
|
| 116 |
+
- 为您提供新类型的 ACG 风格标注;
|
| 117 |
+
- 提出改进模型泛化性的训练技巧;
|
| 118 |
+
- 添加更多语言的模型描述和推理 API 示例;
|
| 119 |
+
|
| 120 |
+
---
|
| 121 |
+
|
| 122 |
+
## 许可协议
|
| 123 |
+
|
| 124 |
+
MIT License,你可以自由用于研究和商业用途。详情请见 [LICENSE](LICENSE)。
|
| 125 |
+
|