LovelyBuggies
/

2xQwen2.5-Coder-3B-Phoenix-Aux

Text Generation

text-generation-inference

Model card Files Files and versions

2xQwen2.5-Coder-3B-Phoenix-Aux / README.md

LovelyBuggies's picture

Add model README

669ef39 verified 4 months ago

|

history blame contribute delete

358 Bytes

	---
	license: apache-2.0
	base_model: Qwen/Qwen2.5-Coder-3B
	tags:
	- code
	- humaneval
	- multi-agent
	- mlgrpo
	- qwen2.5
	library_name: transformers
	pipeline_tag: text-generation
	---

	# 2xQwen2.5-Coder-3B-Pheonix-Aux

	This model is a fine-tuned version of Qwen/Qwen2.5-Coder-3B using Multi-LLM Group Relative Policy Optimization (MAGRPO) on HumanEval dataset.