sii-research
/

InnoSpark-HPC-RM-32B

Safetensors

qwen2

Model card Files Files and versions

xet

Community

innospark commited on Jul 25

Commit

ee96c5c

verified ·

1 Parent(s): fa930ad

Update README.md

Browse files

Files changed (1) hide show

README.md +31 -3

README.md CHANGED Viewed

@@ -50,13 +50,41 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 device = "cuda" # the device to load the model onto
 model = AutoModelForCausalLM.from_pretrained(
-    "sii-research/InnoSpark-72B-0710",
     torch_dtype="auto",
     device_map="auto"
 )
-tokenizer = AutoTokenizer.from_pretrained("sii-research/InnoSpark-72B-0710")
-prompt = "Introduce yourself in detail."
 messages = [
     {"role": "system", "content": "You are InnoSpark（启创）, created by Shanghai Innovation Institute （上海创智学院） and East China Normal University(华东师范大学). You are a helpful assistant."},
     {"role": "user", "content": prompt}

 device = "cuda" # the device to load the model onto
 model = AutoModelForCausalLM.from_pretrained(
+    "sii-research/InnoSpark-HPC-RM-32B",
     torch_dtype="auto",
     device_map="auto"
 )
+tokenizer = AutoTokenizer.from_pretrained("sii-research/InnoSpark-HPC-RM-32B")
+Q = ""
+A = ""
+prompt = f'''用户问了一个问题如下：
+{Q}
+下面是模型给的回复如下：
+{A}
+请你进行仔细的思考从意义深度，创造力，个性化3个角度分别进行考虑，对模型给出的回答进行打分，评分范围为0，1，2。分数越高表示模型在该方面的能力表现越好。
+具体的评分要求如下：
+意义深度方面：
+1.如果模型的回复在内容上具有深刻内涵，且高度体现了积极、健康、富有启发性的思想内容，则“意义深度”的得分为2 ；如果模型的回复仅表面回答问题，但未能有效传
+达更深层次的思考或正向导向，缺乏启发性，则“意义深度”的得分为1；如果模型的回复内容浅薄、空泛，缺乏任何积极意义，甚至存在误导或极端倾向，则“意义深度”的
+得分为0
+2.如果模型能够在回答问题的同时，通过潜移默化的方式传达出积极向上、有教育意义的内容，体现出良好的思想表达与语言组织，则可视为得分为2
+3.如果模型本有机会通过更高质量的内容传递有意义的信息，但最终未能展现出来，得分为1
+4.如果回答内容缺乏任何内涵，甚至引起误解或产生负面情绪影响，则得分为0
+创造力方面：
+1.如果模型的回复能够非常好进一步激发用户的思考，提升用户的创造力，则创造力的得分为2；如果模型的回复能够一定程度上激发用户的思考，来培养用户的创造力，
+则创造力的得分为1；如果模型的回复完全没有激发用户思考的作用，则创造力的得分为0
+2.如果模型的回复在回答问题的同时，给出了更多思考问题，更多的解题方法或思路，给出了激发用户思考的一些问题，能够多角度解释，提供有趣易懂的新颖独创的解
+答和回复，具有多种解题，解答方式,则创造力的得分为2
+3.如果模型的回复在回答问题的同时，一定程度上给出了更多思考问题，更多的解题方法或思路，但仍然有改进空间，则创造力的得分为1
+4.如果模型的回复只是简单的回答问题，没有任何激发用户思考的回复内容，则创造力的得分为0
+个性化方面：
+1.如果用户的问题中不存在任何用户的个性化信息（个人信息或个人画像，性格，年龄身份等），则个性化的得分为2
+2.如果问题中存在了用户的个性化信息（个人信息或个人画像），且模型的回复非常适合用户，例如年龄，爱好等方面的回复，则个性化的得分为2
+3.如果问题中存在了用户的个性化信息（个人信息或个人画像），但模型的回复不是非常完美地适合于该用户，存在改进的空间，则个性化的得分为1
+4.如果问题中存在了用户的个性化信息（个人信息或个人画像），但模型的回复是非常通用的，完全没有考虑到用户的信息来给出更好的回复，则个性化的得分为0'''
 messages = [
     {"role": "system", "content": "You are InnoSpark（启创）, created by Shanghai Innovation Institute （上海创智学院） and East China Normal University(华东师范大学). You are a helpful assistant."},
     {"role": "user", "content": prompt}