Spaces:

BeveledCube
/

bevelapi

Runtime error

BeveledCube commited on Aug 20, 2024

Commit

8e724ea

1 Parent(s): 30e32ac

Added EOS toke stuff increased new token limit and added QOL features to frontent

Files changed (10) hide show

models/blenderbot.py CHANGED Viewed

@@ -23,6 +23,6 @@ def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
   # Generate output using the model
-  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

   input_ids = tokenizer.encode(input_text, return_tensors="pt")
   # Generate output using the model
+  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100, eos_token_id=tokenizer.eos_token_id)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

models/fast.py CHANGED Viewed

@@ -11,6 +11,6 @@ def load():
 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
-  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
+  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100, eos_token_id=tokenizer.eos_token_id)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

models/gpt2.py CHANGED Viewed

@@ -16,6 +16,6 @@ def generate(input_text):
   attention_mask = tf.ones_like(input_ids)
   # Generate output using the model
-  output_ids = model.generate(input_ids, num_beams=5, no_repeat_ngram_size=2, max_new_tokens=100)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

   attention_mask = tf.ones_like(input_ids)
   # Generate output using the model
+  output_ids = model.generate(input_ids, num_beams=5, no_repeat_ngram_size=2, max_new_tokens=100, eos_token_id=tokenizer.eos_token_id)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

models/hermes.py CHANGED Viewed

@@ -13,6 +13,6 @@ tokenizer = AutoTokenizer.from_pretrained(model_name)
 def generate(messages):
   gen_input = tokenizer.apply_chat_template(messages, return_tensors="pt")
-  output_ids = model.generate(**gen_input, num_beams=5, no_repeat_ngram_size=2, max_new_tokens=100)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

 def generate(messages):
   gen_input = tokenizer.apply_chat_template(messages, return_tensors="pt")
+  output_ids = model.generate(**gen_input, num_beams=5, no_repeat_ngram_size=2, max_new_tokens=100, eos_token_id=tokenizer.eos_token_id)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

models/llama2.py CHANGED Viewed

@@ -11,6 +11,6 @@ def load():
 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
-  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
+  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100, eos_token_id=tokenizer.eos_token_id)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

models/llama3.py CHANGED Viewed

@@ -11,6 +11,6 @@ def load():
 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
-  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
+  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100, eos_token_id=tokenizer.eos_token_id)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

models/llamatiny.py CHANGED Viewed

@@ -11,6 +11,6 @@ def load():
 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
-  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
+  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100, eos_token_id=tokenizer.eos_token_id)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

models/mamba.py CHANGED Viewed

@@ -11,6 +11,6 @@ def load():
 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
-  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
+  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100, eos_token_id=tokenizer.eos_token_id)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

models/tinystories.py CHANGED Viewed

@@ -11,6 +11,12 @@ def load():
 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
-  output_ids = model.generate(input_ids, no_repeat_ngram_size=2, max_new_tokens=100)
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

 def generate(input_text):
   input_ids = tokenizer.encode(input_text, return_tensors="pt")
+  output_ids = model.generate(
+    input_ids,
+    no_repeat_ngram_size=2,
+    max_new_tokens=200,
+    eos_token_id=tokenizer.eos_token_id,
+    temperature=0.2
+  )
   return tokenizer.decode(output_ids[0], skip_special_tokens=True)

templates/index.html CHANGED Viewed

@@ -74,12 +74,23 @@
     const apiUrl = `https://beveledcube-bevelapi.hf.space/api`;
     const sendPromptButton = document.getElementById("send-prompt");
     const responseContainer = document.getElementById("responses");
-    sendPromptButton.addEventListener("click", async () => {
       console.log("Sending prompt")
       const responseElement = document.createElement("div");
-      const requestData = { prompt: getValue("prompt") };
       responseElement.classList.add("response-container");
@@ -114,8 +125,7 @@
         .catch(error => {
           console.error("Error:", error.message);
         });
-    });
     function getValue(elementId) {
       return document.getElementById(elementId).value;

     const apiUrl = `https://beveledcube-bevelapi.hf.space/api`;
     const sendPromptButton = document.getElementById("send-prompt");
     const responseContainer = document.getElementById("responses");
+    let promptInput = document.getElementById("prompt")
+    sendPromptButton.addEventListener("click", () => sendPrompt());
+    promptInput.addEventListener("keydown", (event) => {
+      if (event.key === "Enter") {
+        // Prevent the default action if needed (e.g., form submission)
+        event.preventDefault();
+        sendPrompt()
+      }
+    });
+    function sendPrompt() {
       console.log("Sending prompt")
       const responseElement = document.createElement("div");
+      const requestData = { prompt: promptInput.value };
+      promptInput.value = "";
       responseElement.classList.add("response-container");
         .catch(error => {
           console.error("Error:", error.message);
         });
+    }
     function getValue(elementId) {
       return document.getElementById(elementId).value;