IsACG – “是否是 ACG 图像”的二分类模型系列
IsACG 是一个专注于判断图像是否为 ACG(Anime、Comic、Game)风格的轻量化图像分类系列模型。模型基于 MobileNetV3-Large 和 MobileNetV3-Small 构建,在保证性能的同时注重低资源占用,适用于多种部署环境。
模型架构说明
v1:
mobilenet_v3_large
- 参数量约为 5.5M;
- 更高的分类精度,适用于中端服务器或推理精度优先的场景。
v1s:
mobilenet_v3_small
- 参数量约为 2.5M;
- 更轻便、更快的推理速度,适合边缘设备、嵌入式系统和移动端部署。
v2:v1s 的改进版本,融合了更广泛的数据训练和数据增强,提升泛化性;
- 参数量相近;
- 在复杂图像(如风格混合、低分辨率)上更具鲁棒性。
分类任务
- 目标标签:二分类
"yes"
:图像为动漫、漫画或游戏相关风格;"no"
:图像为现实照片、插画或其他非 ACG 风格。
快速使用
模型配置
默认标签配置:
{
"0": "no",
"1": "yes"
}
模型性能对比(示例)
模型版本 | 架构 | Accuracy | 推理速度 (FPS) | 参数量 | 主要特点 |
---|---|---|---|---|---|
v1 | MobileNetV3-Large | 99.1% | 35 | 5.5M | 精度高,适用于服务器环境 |
v1s | MobileNetV3-Small | 98.9% | 65 | 2.5M | 轻量、快,在移动设备上表现好 |
v2 | MobileNetV3-Small | 97.5% | 58 | 2.5M | 增强泛化,适用更多风格 |
数据来源与训练
- 数据集结构:
- 正样本:ACG 图像(动漫截图、漫画分镜、游戏画面);
- 负样本:非 ACG 图像(照片、现代 UI、3D 渲染、自然风景等);
- 优化器:AdamW
- 学习率调度:ReduceLROnPlateau
- 训练框架:PyTorch + TorchVision 库;
- 支持图像尺寸:512x512 或上下文自适应填充。
示例输出
输入图像 | 输出类别 |
---|---|
动漫插画截图 | "yes" |
漫画分镜 | "yes" |
Steam 商店游戏页面截图 | "yes" |
真实风景照 | "no" |
人物写实照片 | "no" |
篮球明星图像 | "no" |
模型适用场景
✅ ACG 图像内容识别与过滤 ✅ 自动打标与数据筛选系统 ✅ 风格分类器嵌入到多模态 AI 系统中 ✅ 低资源设备(v1s/v2)快速判断
贡献与扩展
该项目遵循 MIT 协议开源,欢迎贡献和改进:
- 为您提供新类型的 ACG 风格标注;
- 提出改进模型泛化性的训练技巧;
- 添加更多语言的模型描述和推理 API 示例;
许可协议
MIT License,你可以自由用于研究和商业用途。详情请见 LICENSE。
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support