openlm-research
/

open_llama_3b_v2

Text Generation

text-generation-inference

Model card Files Files and versions

Upload FlaxLlamaForCausalLM

#13

by afmck - opened Oct 7, 2023

base: refs/heads/main

←

from: refs/pr/13

Discussion Files changed

Files changed (3) hide show

config.json +5 -1
flax_model.msgpack +3 -0
generation_config.json +1 -1

config.json CHANGED Viewed

@@ -12,11 +12,15 @@
   "model_type": "llama",
   "num_attention_heads": 32,
   "num_hidden_layers": 26,
   "pad_token_id": 0,
   "rms_norm_eps": 1e-06,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
-  "transformers_version": "4.31.0.dev0",
   "use_cache": true,
   "vocab_size": 32000
 }

   "model_type": "llama",
   "num_attention_heads": 32,
   "num_hidden_layers": 26,
+  "num_key_value_heads": 32,
   "pad_token_id": 0,
+  "pretraining_tp": 1,
   "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
+  "transformers_version": "4.34.0.dev0",
   "use_cache": true,
   "vocab_size": 32000
 }

flax_model.msgpack ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:20232d4151e2b09f3488a85022045a5d9341013c96aa55078dd0647c9484bb6f
+size 6852958203

generation_config.json CHANGED Viewed

@@ -3,5 +3,5 @@
   "bos_token_id": 1,
   "eos_token_id": 2,
   "pad_token_id": 0,
-  "transformers_version": "4.31.0.dev0"
 }

   "bos_token_id": 1,
   "eos_token_id": 2,
   "pad_token_id": 0,
+  "transformers_version": "4.34.0.dev0"
 }