moyanjdc commited on
Commit
12e43f2
·
verified ·
1 Parent(s): 34274a7

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +119 -3
README.md CHANGED
@@ -1,9 +1,125 @@
1
  ---
2
  license: mit
3
  language:
4
- - zh
5
- - en
6
  pipeline_tag: image-classification
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7
  ---
8
 
9
- # IsACG
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  license: mit
3
  language:
4
+ - zh
5
+ - en
6
  pipeline_tag: image-classification
7
+ tags:
8
+ - image-classification
9
+ - binary-classification
10
+ - mobilenetv3
11
+ - pytorch
12
+ - acg
13
+ - anime
14
+ - comic
15
+ - game
16
+ - computer-vision
17
+
18
+ ---
19
+
20
+ # IsACG – “是否是 ACG 图像”的二分类模型系列
21
+
22
+ IsACG 是一个专注于判断图像是否为 ACG(**Anime、Comic、Game**)风格的轻量化图像分类系列模型。模型基于 **MobileNetV3-Large** 和 **MobileNetV3-Small** 构建,在保证性能的同时注重低资源占用,适用于多种部署环境。
23
+
24
+ ---
25
+
26
+ ## 模型架构说明
27
+
28
+ - **v1**:`mobilenet_v3_large`
29
+ - 参数量约为 5.5M;
30
+ - 更高的分类精度,适用于中端服务器或推理精度优先的场景。
31
+
32
+ - **v1s**:`mobilenet_v3_small`
33
+ - 参数量约为 2.5M;
34
+ - 更轻便、更快的推理速度,适合边缘设备、嵌入式系统和移动端部署。
35
+
36
+ - **v2**:v1s 的改进版本,融合了更广泛的数据训练和数据增强,提升泛化性;
37
+ - 参数量相近;
38
+ - 在复杂图像(如风格混合、低分辨率)上更具鲁棒性。
39
+
40
+ ---
41
+
42
+ ## 分类任务
43
+
44
+ - **目标标签**:二分类
45
+ - `"yes"`:图像为动漫、漫画或游戏相关风格;
46
+ - `"no"`:图像为现实照片、插画或其他非 ACG 风格。
47
+
48
+ ---
49
+
50
+ ## 快速使用
51
+
52
+
53
+
54
+ ---
55
+
56
+ ## 模型配置
57
+
58
+ 默认标签配置:
59
+ ```json
60
+ {
61
+ "0": "no",
62
+ "1": "yes"
63
+ }
64
+ ```
65
+
66
  ---
67
 
68
+ ## 模型性能对比(示例)
69
+
70
+ | 模型版本 | 架构 | Accuracy | 推理速度 (FPS) | 参数量 | 主要特点 |
71
+ |----------|------------------|----------|----------------|--------|----------------------------|
72
+ | v1 | MobileNetV3-Large | 99.1% | 35 | 5.5M | 精度高,适用于服务器环境 |
73
+ | v1s | MobileNetV3-Small | 98.9% | 65 | 2.5M | 轻量、快,在移动设备上表现好 |
74
+ | v2 | MobileNetV3-Small | 97.5% | 58 | 2.5M | 增强泛化,适用更多风格 |
75
+
76
+ ---
77
+
78
+ ## 数据来源与训练
79
+
80
+ - **数据集结构**:
81
+ - 正样本:ACG 图像(动漫截图、漫画分镜、游戏画面);
82
+ - 负样本:非 ACG 图像(照片、现代 UI、3D 渲染、自然风景等);
83
+ - **优化器**:AdamW
84
+ - **学习率调度**:ReduceLROnPlateau
85
+ - **训练框架**:PyTorch + TorchVision 库;
86
+ - **支持图像尺寸**:512x512 或上下文自适应填充。
87
+
88
+ ---
89
+
90
+ ## 示例输出
91
+
92
+ | 输入图像 | 输出类别 |
93
+ |----------------------|--------------|
94
+ | 动漫插画截图 | `"yes"` |
95
+ | 漫画分镜 | `"yes"` |
96
+ | Steam 商店游戏页面截图 | `"yes"` |
97
+ | 真实风景照 | `"no"` |
98
+ | 人物写实照片 | `"no"` |
99
+ | 篮球明星图像 | `"no"` |
100
+
101
+ ---
102
+
103
+ ## 模型适用场景
104
+
105
+ ✅ ACG 图像内容识别与过滤
106
+ ✅ 自动打标与数据筛选系统
107
+ ✅ 风格分类器嵌入到多模态 AI 系统中
108
+ ✅ 低资源设备(v1s/v2)快速判断
109
+
110
+ ---
111
+
112
+ ## 贡献与扩展
113
+
114
+ 该项目遵循 MIT 协议开源,欢迎贡献和改进:
115
+
116
+ - 为您提供新类型的 ACG 风格标注;
117
+ - 提出改进模型泛化性的训练技巧;
118
+ - 添加更多语言的模型描述和推理 API 示例;
119
+
120
+ ---
121
+
122
+ ## 许可协议
123
+
124
+ MIT License,你可以自由用于研究和商业用途。详情请见 [LICENSE](LICENSE)。
125
+