RedHatAI
/

Qwen3-0.6B-quantized.w4a16

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions

alexmarques commited on May 12

Commit

3bceedd

·

verified ·

1 Parent(s): 2962787

Update README.md

Files changed (1) hide show

README.md +21 -21

README.md CHANGED Viewed

@@ -255,71 +255,71 @@ The model was evaluated on the OpenLLM leaderboard tasks (versions 1 and 2), usi
    </td>
    <td>MMLU (5-shot)
    </td>
-   <td>80.96
    </td>
-   <td>80.36
    </td>
-   <td>99.3%
    </td>
   </tr>
   <tr>
    <td>ARC Challenge (25-shot)
    </td>
-   <td>69.03
    </td>
-   <td>68.69
    </td>
-   <td>99.5%
    </td>
   </tr>
   <tr>
    <td>GSM-8K (5-shot, strict-match)
    </td>
-   <td>87.64
    </td>
-   <td>85.97
    </td>
-   <td>98.1%
    </td>
   </tr>
   <tr>
    <td>Hellaswag (10-shot)
    </td>
-   <td>71.10
    </td>
-   <td>71.18
    </td>
-   <td>100.1%
    </td>
   </tr>
   <tr>
    <td>Winogrande (5-shot)
    </td>
-   <td>69.77
    </td>
-   <td>70.90
    </td>
-   <td>100.5%
    </td>
   </tr>
   <tr>
    <td>TruthfulQA (0-shot, mc2)
    </td>
-   <td>58.63
    </td>
-   <td>58.86
    </td>
-   <td>100.4%
    </td>
   </tr>
   <tr>
    <td><strong>Average</strong>
    </td>
-   <td><strong>72.86</strong>
    </td>
-   <td><strong>72.52</strong>
    </td>
-   <td><strong>99.6%</strong>
    </td>
   </tr>
   <tr>

    </td>
    <td>MMLU (5-shot)
    </td>
+   <td>42.82
    </td>
+   <td>39.80
    </td>
+   <td>93.00%
    </td>
   </tr>
   <tr>
    <td>ARC Challenge (25-shot)
    </td>
+   <td>32.85
    </td>
+   <td>30.72
    </td>
+   <td>93.5%
    </td>
   </tr>
   <tr>
    <td>GSM-8K (5-shot, strict-match)
    </td>
+   <td>1.82
    </td>
+   <td>2.20
    </td>
+   <td>---
    </td>
   </tr>
   <tr>
    <td>Hellaswag (10-shot)
    </td>
+   <td>43.04
    </td>
+   <td>41.02
    </td>
+   <td>95.3%
    </td>
   </tr>
   <tr>
    <td>Winogrande (5-shot)
    </td>
+   <td>54.54
    </td>
+   <td>54.62
    </td>
+   <td>100.1%
    </td>
   </tr>
   <tr>
    <td>TruthfulQA (0-shot, mc2)
    </td>
+   <td>51.61
    </td>
+   <td>48.77
    </td>
+   <td>94.5%
    </td>
   </tr>
   <tr>
    <td><strong>Average</strong>
    </td>
+   <td><strong>37.78</strong>
    </td>
+   <td><strong>36.19</strong>
    </td>
+   <td><strong>95.8%</strong>
    </td>
   </tr>
   <tr>