IsACG – “是否是 ACG 图像”的二分类模型系列

IsACG 是一个专注于判断图像是否为 ACG(Anime、Comic、Game)风格的轻量化图像分类系列模型。模型基于 MobileNetV3-LargeMobileNetV3-Small 构建,在保证性能的同时注重低资源占用,适用于多种部署环境。


模型架构说明

  • v1mobilenet_v3_large

    • 参数量约为 5.5M;
    • 更高的分类精度,适用于中端服务器或推理精度优先的场景。
  • v1smobilenet_v3_small

    • 参数量约为 2.5M;
    • 更轻便、更快的推理速度,适合边缘设备、嵌入式系统和移动端部署。
  • v2:v1s 的改进版本,融合了更广泛的数据训练和数据增强,提升泛化性;

    • 参数量相近;
    • 在复杂图像(如风格混合、低分辨率)上更具鲁棒性。

分类任务

  • 目标标签:二分类
    • "yes":图像为动漫、漫画或游戏相关风格;
    • "no":图像为现实照片、插画或其他非 ACG 风格。

快速使用


模型配置

默认标签配置:

{
    "0": "no",
    "1": "yes"
}

模型性能对比(示例)

模型版本 架构 Accuracy 推理速度 (FPS) 参数量 主要特点
v1 MobileNetV3-Large 99.1% 35 5.5M 精度高,适用于服务器环境
v1s MobileNetV3-Small 98.9% 65 2.5M 轻量、快,在移动设备上表现好
v2 MobileNetV3-Small 97.5% 58 2.5M 增强泛化,适用更多风格

数据来源与训练

  • 数据集结构
    • 正样本:ACG 图像(动漫截图、漫画分镜、游戏画面);
    • 负样本:非 ACG 图像(照片、现代 UI、3D 渲染、自然风景等);
  • 优化器:AdamW
  • 学习率调度:ReduceLROnPlateau
  • 训练框架:PyTorch + TorchVision 库;
  • 支持图像尺寸:512x512 或上下文自适应填充。

示例输出

输入图像 输出类别
动漫插画截图 "yes"
漫画分镜 "yes"
Steam 商店游戏页面截图 "yes"
真实风景照 "no"
人物写实照片 "no"
篮球明星图像 "no"

模型适用场景

✅ ACG 图像内容识别与过滤 ✅ 自动打标与数据筛选系统 ✅ 风格分类器嵌入到多模态 AI 系统中 ✅ 低资源设备(v1s/v2)快速判断


贡献与扩展

该项目遵循 MIT 协议开源,欢迎贡献和改进:

  • 为您提供新类型的 ACG 风格标注;
  • 提出改进模型泛化性的训练技巧;
  • 添加更多语言的模型描述和推理 API 示例;

许可协议

MIT License,你可以自由用于研究和商业用途。详情请见 LICENSE

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support