Unit_3_Agentic_RAG

Sleeping

laverdes commited on May 14

Commit

e235492

verified ·

1 Parent(s): 5026d1a

feat: extract_text tool for LangGraph agent

Files changed (1) hide show

retriever.py CHANGED Viewed

@@ -1,35 +1,12 @@
-from smolagents import Tool
-from langchain_community.retrievers import BM25Retriever
-from langchain.docstore.document import Document
 import datasets
-class GuestInfoRetrieverTool(Tool):
-    name = "guest_info_retriever"
-    description = "Retrieves detailed information about gala guests based on their name or relation."
-    inputs = {
-        "query": {
-            "type": "string",
-            "description": "The name or relation of the guest you want information about."
-        }
-    }
-    output_type = "string"
-    def __init__(self, docs):
-        self.is_initialized = False
-        self.retriever = BM25Retriever.from_documents(docs)
-    def forward(self, query: str):
-        results = self.retriever.get_relevant_documents(query)
-        if results:
-            return "\n\n".join([doc.page_content for doc in results[:3]])
-        else:
-            return "No matching guest information found."
 def load_guest_dataset():
-    # Load the dataset
     guest_dataset = datasets.load_dataset("agents-course/unit3-invitees", split="train")
     # Convert dataset entries into Document objects
@@ -46,8 +23,33 @@ def load_guest_dataset():
         for guest in guest_dataset
     ]
-    # Return the tool
-    return GuestInfoRetrieverTool(docs)

 import datasets
+from langchain.docstore.document import Document
+from langchain_community.retrievers import BM25Retriever
+from langchain.tools import Tool
 def load_guest_dataset():
+    """Loads the guest dataset and converts it into Document objects."""
     guest_dataset = datasets.load_dataset("agents-course/unit3-invitees", split="train")
     # Convert dataset entries into Document objects
         for guest in guest_dataset
     ]
+    # Return the documents
+    return docs
+# Load the dataset
+docs = load_guest_dataset()
+# Initialize the retriever
+bm25_retriever = BM25Retriever.from_documents(docs)
+def extract_text(query: str) -> str:
+    """Retrieves detailed information about gala guests based on their name or relation."""
+    results = bm25_retriever.invoke(query)
+    if results:
+        return results[0].page_content  # [doc.page_content for doc in results[:1]]), :3
+    else:
+        return "No matching guest information found."
+guest_info_tool = Tool(
+    name="guest_info_retriever",
+    func=extract_text,
+    description="Retrieves detailed information about gala guests based on their name or relation."
+)
+if __name__ == "__main__":
+    query = "Marie"
+    print(f"query: {query}:\nretrieval: {extract_text(query)}")