YAML Metadata
Warning:
empty or missing yaml metadata in repo card
(https://huggingface.co/docs/hub/model-cards#model-card-metadata)
history-phi4-lora-sft-v2
本模型 TAIDE-EDU/history-gemma3-taide-sft-v2 專為 高中小論文批改 設計。
輸入論文本體(含 --- Page N --- 分頁標記),模型會輸出 單一 JSON 物件,包含:
annotation:逐頁具體評論(優點、缺點、修正建議)overall:綜合總評(附整體等第)
使用方式(vllm)
import transformers
# 論文本體(需自行放入)
paper_text = """
--- Page 1 ---
這裡是論文的第一頁內容...
--- Page 2 ---
這裡是論文的第二頁內容...
"""
from vllm import LLM, SamplingParams
import json
model_name = "TAIDE-EDU/history-gemma3-taide-sft-v2"
template_example = {
"annotation": [
{
"page": "<該評論所對應的頁碼(整數;無法定位填 0)>",
"text": "<被評論的原文或段落標題>",
"content": (
"<詳細評論,務必包含:優點、缺點、具體修正建議;"
"若為五個核心部分之一,請在末行加入「等第:優等/中等/待加強」。"
"一般段落或細節評論則不要加入等第。>"
)
}
],
"overall": "<以繁體中文撰寫的一段綜合總評,文末以(優等/中等/待加強)標註整體等第>"
}
schema_types = {
"type": "object",
"additionalProperties": False,
"required": ["annotation", "overall"],
"properties": {
"annotation": {
"type": "array",
"items": {
"type": "object",
"additionalProperties": False,
"required": ["page", "text", "content"],
"properties": {
"page": {"type": "integer", "minimum": 0},
"text": {"type": "string"},
"content": {"type": "string"}
}
}
},
"overall": {"type": "string"}
}
}
llm = LLM(model=model_name)
sampling_params = SamplingParams(
temperature=0.2,
top_p=0.2,
max_tokens=10240,
repetition_penalty=1.3
)
conversation = [
{
"role": "system",
"content": (
"你是一位使用繁體中文的頂尖學者,正以『極度嚴苛』的標準審查一篇小論文。你的任務是找出所有潛在的弱點,無論大小,從核心論證的瑕疵到最細微的用詞不當,都不能放過。你的評論風格應直接、精準,但目標是幫助作者提升至最高水平。"
"只根據使用者提供的論文內容輸出,不得臆測或補寫原文不存在的資訊。"
"回覆必須且只允許為『一個 JSON 物件』,不得包含任何多餘說明或 Markdown。"
"本任務產出兩個鍵:annotation(批改清單)與 overall(綜合總評)。"
"annotation 陣列中 page 必須為整數頁碼,應依據文中的 '--- Page N ---' 標記填入;無法定位時填 0。"
"【關於 annotation.content 的要求】必須提供『具體可操作』的評語:包含優點、缺點,以及明確的修正建議,"
" - 優點:可簡要提及,但絕非評論重點。"
" - 缺點:除了明顯的錯誤(如錯字、格式),更必須深入挖掘「邏輯上的矛盾或跳躍、論證強度不足、證據詮釋過於表面、分析深度不夠、前提假設未受檢驗、語意模糊、用詞不夠學術或精準、段落間缺乏順暢銜接」等問題。"
" - 修正建議:必須極度具體。例如,不要只說「建議補充更多文獻」,而是要指出「建議針對 OOO 論點,補充說明 XXX 觀點的文獻,以強化對比」。不要只說「語句不通順」,而是要「直接提供修改後的句子範例」。"
"若為五個核心部分(題目、前言、文獻探討、研究方法、參考文獻)之一,請在開頭加入「等第:優等/中等/待加強」,其他一般評論不須給等第。"
"在最後【綜合總評】中,各部份的重視程度大致可參考以下比例:題目10%, 前言30%, 文獻探討40%, 研究方法10%, 參考文獻10%。"
)
},
{
"role": "user",
"content": (
"【任務】根據下列『論文本體』,產出兩個欄位:annotation、overall。\n"
"【輸出模板(非約束示例)】請仿照下列鍵名與語義,但不要輸出尖括號與說明文字:\n"
f"{template_example}\n"
"【型別約束(必須符合)】你的輸出在型別上必須符合以下 JSON Schema:\n"
f"{schema_types}\n"
"【注意事項】\n"
"1)批改時請以『極度嚴苛』的標準審查,清楚指出錯誤與不足,並說明原因與改進方式。同時肯定論文中表現優異的部分,給予具體的鼓勵。語氣應兼具批判性與建設性,避免模糊不清或情緒化的評價。"
"2) 僅輸出一個 JSON 物件;不得有額外說明或 Markdown。"
"3) 必用繁體中文。"
"4) 請使用文中的 '--- Page N ---' 分頁標記來判斷 annotation.page 的頁碼;若無法定位,填 0。"
"5) 若資訊不足,對應欄位填空字串 \"\" 或空陣列 [],不得臆測補齊。\n"
"【論文本體】\n"
f"{paper_text}"
)
}
]
outputs = llm.chat(conversation, sampling_params=sampling_params)
result_text = outputs[0].outputs[0].text.strip()
print(f"=== Model output ===\n{result_text}\n")
輸出範例
{
"annotation": [
{
"page": 1,
"text": "壹、前言",
"content": "前言:優等\n研究動機具有個人經驗與現實觀察的結合,真實且具說服力。"
},
{
"page": 2,
"text": "某段落",
"content": "某段落評價內容。"
}
],
"overall": "整體而言,本文在研究動機的說明上尚可,但文獻探討不足,建議補充來源以增加完整性。整體等第判定為「中等」。"
}
- Downloads last month
- 90
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support