Spaces:

saeedfarzi
/

trail_leaderboard

Sleeping

App Files Files Community

trail_leaderboard / e3c_llm_results /Qwen /Qwen2.5-14B-Instruct-1M_0_SL.json

Sfarzi

Initial clone with modifications

f7a50a0 about 1 month ago

raw

history blame contribute delete

3.49 kB

	{
	"average_CPS": 37.45460366666667,
	"config": {
	"model_name": "Qwen/Qwen2.5-14B-Instruct-1M",
	"num_fewshot": "0",
	"batch_size": 1,
	"LANG": "SL",
	"model": "Qwen/Qwen2.5-14B-Instruct-1M",
	"base_model": "Qwen2ForCausalLM",
	"revision": "620fad32de7bdd2293b3d99b39eba2fe63e97438",
	"submitted_time": "2025-01-23 13:23:24+00:00",
	"num_params_billion": 14.770033664,
	"language": "en"
	},
	"tasks": {
	"NER": {
	"prompts": [
	{
	"prompt": "p1",
	"metric": "f1",
	"value": 39.1,
	"stderr": 0.0
	},
	{
	"prompt": "p2",
	"metric": "f1",
	"value": 23.75,
	"stderr": 0.0
	},
	{
	"prompt": "p3",
	"metric": "f1",
	"value": 39.1,
	"stderr": 0.0
	}
	],
	"average_accuracy": 33.983333333333334,
	"best_prompt": 39.1,
	"prompt_id": "p1",
	"CPS": 37.099383333333336,
	"is_dummy": false,
	"std_accuracy": 8.862326632060757
	},
	"RE": {
	"prompts": [
	{
	"prompt": "p1",
	"metric": "f1",
	"value": 37.75,
	"stderr": 0.0
	},
	{
	"prompt": "p2",
	"metric": "f1",
	"value": 37.830000000000005,
	"stderr": 0.0
	},
	{
	"prompt": "p3",
	"metric": "f1",
	"value": 37.75,
	"stderr": 0.0
	}
	],
	"average_accuracy": 37.77666666666667,
	"best_prompt": 37.830000000000005,
	"prompt_id": "p2",
	"CPS": 37.809824000000006,
	"is_dummy": false,
	"std_accuracy": 0.04618802153517318
	},
	"RML": {
	"prompts": [
	{
	"prompt": "p1",
	"metric": "f1",
	"value": 0.0,
	"stderr": 0.0
	}
	],
	"average_accuracy": null,
	"std_accuracy": null,
	"best_prompt": null,
	"prompt_id": null,
	"CPS": null,
	"is_dummy": true
	},
	"HIS": {
	"prompts": [
	{
	"prompt": "p1",
	"metric": "f1",
	"value": 0.0,
	"stderr": 0.0
	}
	],
	"average_accuracy": null,
	"std_accuracy": null,
	"best_prompt": null,
	"prompt_id": null,
	"CPS": null,
	"is_dummy": true
	},
	"DIA": {
	"prompts": [
	{
	"prompt": "p1",
	"metric": "f1",
	"value": 0.0,
	"stderr": 0.0
	}
	],
	"average_accuracy": null,
	"std_accuracy": null,
	"best_prompt": null,
	"prompt_id": null,
	"CPS": null,
	"is_dummy": true
	}
	}
	}