Spaces:

LoneWolfgang
/

Abalone-RAG-Demo

Running

App Files Files Community

LoneWolfgang commited on Nov 12

Commit

01bfc89

1 Parent(s): b840334

Added Generation

Browse files

Files changed (1) hide show

app.py +53 -27

app.py CHANGED Viewed

@@ -4,9 +4,10 @@ import pickle
 import sentence_transformers
 import faiss
 import gradio as gr
 # ------------------------------
-# Configuration: URLs to your files
 # ------------------------------
 INDEX_URL = "https://huggingface.co/LoneWolfgang/abalone-index/resolve/main/index.faiss"
 DOCSTORE_URL = "https://huggingface.co/LoneWolfgang/abalone-index/resolve/main/docstore.pkl"
@@ -31,21 +32,18 @@ def download_file(url, dest_path):
     else:
         print(f"{dest_path} already exists, skipping download.")
-# Download the FAISS index and docstore
 download_file(INDEX_URL, os.path.join(INDEX_DIR, "index.faiss"))
 download_file(DOCSTORE_URL, os.path.join(INDEX_DIR, "docstore.pkl"))
 # ------------------------------
-# Retriever class
 # ------------------------------
 class Retriever:
     def __init__(self, index_dir, sbert_model="all-MiniLM-L12-v2"):
-        # Load FAISS index
         self.index = faiss.read_index(os.path.join(index_dir, "index.faiss"))
-        # Load docstore
         with open(os.path.join(index_dir, "docstore.pkl"), "rb") as f:
             self.segments = pickle.load(f)
-        # Load SentenceTransformer
         self.sbert = sentence_transformers.SentenceTransformer(sbert_model)
     def preprocess_query(self, query):
@@ -53,38 +51,66 @@ class Retriever:
         faiss.normalize_L2(embedding)
         return embedding
-    def retrieve(self, query, k=5):
         embedding = self.preprocess_query(query)
         D, I = self.index.search(embedding, k)
-        results = []
-        for rank, (idx, score) in enumerate(zip(I[0], D[0]), start=1):
-            text = self.segments[idx]
-            results.append(f"**{rank}. (Score={score:.4f})**\n{text}")
-        return "\n\n".join(results)
 # ------------------------------
-# Instantiate retriever
 # ------------------------------
-retriever = Retriever(INDEX_DIR)
 # ------------------------------
-# Gradio interface
 # ------------------------------
-def search(query, top_k):
-    return retriever.retrieve(query, k=top_k)
 demo = gr.Interface(
-    fn=search,
-    inputs=[
-        gr.Textbox(label="Enter your query"),
-        gr.Slider(1, 10, value=5, step=1, label="Top K")
-    ],
-    outputs=gr.Markdown(label="Results"),
-    title="FAISS Retriever",
-    description="Semantic search using SentenceTransformers + FAISS.",
     theme="soft",
-    allow_flagging="never"
 )
 if __name__ == "__main__":
-    demo.launch()

 import sentence_transformers
 import faiss
 import gradio as gr
+from transformers import pipeline
 # ------------------------------
+# Configuration
 # ------------------------------
 INDEX_URL = "https://huggingface.co/LoneWolfgang/abalone-index/resolve/main/index.faiss"
 DOCSTORE_URL = "https://huggingface.co/LoneWolfgang/abalone-index/resolve/main/docstore.pkl"
     else:
         print(f"{dest_path} already exists, skipping download.")
+# Download index + docstore
 download_file(INDEX_URL, os.path.join(INDEX_DIR, "index.faiss"))
 download_file(DOCSTORE_URL, os.path.join(INDEX_DIR, "docstore.pkl"))
 # ------------------------------
+# Retriever
 # ------------------------------
 class Retriever:
     def __init__(self, index_dir, sbert_model="all-MiniLM-L12-v2"):
         self.index = faiss.read_index(os.path.join(index_dir, "index.faiss"))
         with open(os.path.join(index_dir, "docstore.pkl"), "rb") as f:
             self.segments = pickle.load(f)
         self.sbert = sentence_transformers.SentenceTransformer(sbert_model)
     def preprocess_query(self, query):
         faiss.normalize_L2(embedding)
         return embedding
+    def retrieve(self, query, k=1):
         embedding = self.preprocess_query(query)
         D, I = self.index.search(embedding, k)
+        top_docs = [self.segments[idx] for idx in I[0]]
+        return top_docs, D[0]
 # ------------------------------
+# Lightweight Generator
 # ------------------------------
+# FLAN-T5-base is small (~250M) and fast to run on CPU
+generator = pipeline(
+    "text2text-generation",
+    model="google/flan-t5-base",
+    tokenizer="google/flan-t5-base",
+    max_new_tokens=150,
+    temperature=0.1,
+)
 # ------------------------------
+# Combined function: retrieve → generate
 # ------------------------------
+retriever = Retriever(INDEX_DIR)
+def answer_query(query):
+    docs, scores = retriever.retrieve(query, k=1)
+    record = docs[0]
+    url = record["url"]
+    context = record["text"]
+    prompt = (
+        f"Answer the following question based on the context.\n\n"
+        f"Context:\n{context}\n\n"
+        f"Question: {query}\nAnswer:"
+    )
+    result = generator(prompt)[0]["generated_text"]
+    return f"""
+### Response
+{result}
+---
+**Context**
+{context}
+**[Source]({url})**
+"""
+# ------------------------------
+# Gradio UI
+# ------------------------------
 demo = gr.Interface(
+    fn=answer_query,
+    inputs=gr.Textbox(label="Enter your question"),
+    outputs=gr.Markdown(label="Answer"),
+    title="RAG Demo",
+    description="Retrieves the top 1 passage and generates an answer using FLAN-T5.",
     theme="soft",
 )
 if __name__ == "__main__":
+    demo.launch()