Spaces:
Sleeping
Sleeping
Create report.md (#4)
Browse files- Create report.md (f110859359fd3e88779e0853ba53777837081eb8)
Co-authored-by: 杜冠霖 <[email protected]>
report.md
ADDED
@@ -0,0 +1,24 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# 📊 实验报告
|
2 |
+
|
3 |
+
## 实验目标
|
4 |
+
本实验比较两个 LLM 模型的输出质量,采用 GRACE 框架评估其表现。
|
5 |
+
|
6 |
+
## 模型介绍
|
7 |
+
- **Model A**:GPT-2
|
8 |
+
- **Model B**:DistilGPT2
|
9 |
+
|
10 |
+
## GRACE 维度评分
|
11 |
+
| 模型 | Generalization | Relevance | Artistry | Efficiency |
|
12 |
+
|----------|----------------|-----------|----------|------------|
|
13 |
+
| Model A | 4.0 | 4.5 | 3.5 | 4.0 |
|
14 |
+
| Model B | 3.5 | 4.0 | 4.0 | 3.5 |
|
15 |
+
|
16 |
+
## 总结
|
17 |
+
模型 A 在通用性和效率上表现更优;模型 B 在艺术性方面略胜一筹。
|
18 |
+
|
19 |
+
## 开发分工
|
20 |
+
- 同学 A:实现 Model A 封装、主界面集成与 GRACE 可视化
|
21 |
+
- 同学 B:实现 Model B 封装、Arena 模块与报告撰写
|
22 |
+
|
23 |
+
## 提交记录
|
24 |
+
见 Files 页面和 Git 历史,可追溯每位同学的修改。
|