Spaces:

BinKhoaLe1812
/

EdSummariser

Sleeping

App Files Files Community

EdSummariser / memo /README.md

LiamKhoaLe

Upd memo README

6c7d228 about 2 months ago

preview code

raw

history blame contribute delete

8.64 kB

Memory System for EdSummariser

A sophisticated memory management system that provides intelligent context retrieval, conversation continuity, and enhancement-focused memory planning for the EdSummariser application.

🧠 Key Features

Memory Planning System

Intent Detection: Automatically detects user intent (enhancement, clarification, comparison, etc.)
Strategy Planning: Selects optimal memory retrieval strategy based on user intent
Enhancement Focus: Specialized handling for "Enhance...", "Be more detailed" requests
Q&A Prioritization: Focuses on past Q&A data for enhancement requests

Dual Memory Architecture

Enhanced Memory: MongoDB-based persistent storage with semantic search
Legacy Memory: In-memory LRU system for backward compatibility
Graceful Fallback: Automatically falls back when MongoDB unavailable

Smart Context Retrieval

Semantic Search: Cosine similarity-based memory selection
AI-Powered Selection: NVIDIA model integration for intelligent memory filtering
Session Management: Tracks conversation continuity and context switches
Memory Consolidation: Prevents information overload through intelligent pruning

📁 Architecture

memo/
├── README.md                    # This documentation
├── core.py                      # Main memory system with planning integration
├── planning.py                  # Memory planning and strategy system
├── persistent.py                # MongoDB-based persistent storage
├── legacy.py                    # In-memory LRU system
├── retrieval.py                 # Context retrieval manager
├── conversation.py              # Conversation management orchestrator
├── sessions.py                  # Session tracking and context switching
├── consolidation.py             # Memory consolidation and pruning
├── context.py                   # Context management utilities
├── history.py                   # History management functions
├── nvidia.py                    # NVIDIA API integration
└── plan/                        # Modular planning components
    ├── intent.py                # Intent detection
    ├── strategy.py              # Strategy planning
    └── execution.py             # Execution engine

🚀 Core Capabilities

Enhancement Request Handling

# Automatically detects and handles enhancement requests
question = "Enhance the previous answer about machine learning"
# System uses FOCUSED_QA strategy with Q&A prioritization

Intent-Based Memory Planning

ENHANCEMENT: Uses FOCUSED_QA strategy for detailed responses
CLARIFICATION: Uses RECENT_FOCUS strategy for context
COMPARISON: Uses BROAD_CONTEXT strategy for comprehensive data
REFERENCE: Uses FOCUSED_QA strategy for specific past content
NEW_TOPIC: Uses SEMANTIC_DEEP strategy for discovery

Memory Types

Type	Description	Storage	Usage
`conversation`	Chat history & Q&A pairs	Both	Primary context source
`user_preference`	User preferences	Enhanced only	Personalization
`project_context`	Project-specific knowledge	Enhanced only	Project continuity
`knowledge_fact`	Domain facts	Enhanced only	Knowledge base

🔧 Quick Start

from memo.core import get_memory_system
from memo.planning import get_memory_planner

# Initialize memory system
memory = get_memory_system()
planner = get_memory_planner(memory, embedder)

# Basic operations (backward compatible)
memory.add("user123", "q: What is AI?\na: AI is artificial intelligence")
recent = memory.recent("user123", 3)

# Smart context with planning
recent_context, semantic_context, metadata = await memory.get_smart_context(
    user_id="user123",
    question="Enhance the previous answer about deep learning",
    nvidia_rotator=rotator
)

# Enhancement-specific context
enhancement_context = await memory.get_enhancement_context(
    user_id="user123",
    question="Be more detailed about neural networks",
    nvidia_rotator=rotator
)

🎯 Memory Planning Strategies

FOCUSED_QA (Enhancement Requests)

Prioritizes past Q&A pairs
Uses very low similarity threshold (0.05) for maximum recall
AI-powered selection of most relevant Q&A memories
Optimized for detailed, comprehensive responses

RECENT_FOCUS (Clarification Requests)

Focuses on recent conversation context
Balances recent and semantic context
Ideal for follow-up questions

BROAD_CONTEXT (Comparison Requests)

Retrieves wide range of memories
Higher similarity threshold for relevance
Suitable for comparative analysis

SEMANTIC_DEEP (New Topics)

Deep semantic search across all memories
AI-powered selection for discovery
Comprehensive knowledge retrieval

MIXED_APPROACH (Continuation)

Combines recent and semantic context
Balanced approach for ongoing conversations
Adaptive based on conversation state

🔧 Configuration

# MongoDB Configuration
MONGO_URI=mongodb://localhost:27017
MONGO_DB=studybuddy

# NVIDIA API Configuration
NVIDIA_SMALL=meta/llama-3.1-8b-instruct

🛠️ Key Functions

Core Memory System

get_memory_system() - Main entry point
memory.get_smart_context() - Intelligent context with planning
memory.get_enhancement_context() - Enhancement-specific context
memory.add_conversation_memory() - Add structured memories
memory.search_memories() - Semantic search

Memory Planning

planner.plan_memory_strategy() - Plan retrieval strategy
planner.execute_memory_plan() - Execute planned strategy
planner._detect_user_intent() - Detect user intent

Session Management

session_manager.get_or_create_session() - Session tracking
session_manager.detect_context_switch() - Context switching
session_manager.get_conversation_insights() - Conversation analytics

🧪 Enhancement Request Examples

The system automatically handles various enhancement patterns:

# These all trigger FOCUSED_QA strategy:
"Enhance the previous answer about machine learning"
"Be more detailed about neural networks"
"Elaborate on the explanation of deep learning"
"Tell me more about what we discussed"
"Go deeper into the topic"
"Provide more context about..."

🔬 Technical Details

Intent Detection

Pattern-based detection using regex
AI-powered detection using NVIDIA models
Fallback to continuation for ambiguous cases

Memory Selection

Cosine similarity for semantic matching
AI-powered selection for optimal relevance
Configurable similarity thresholds per strategy

Performance Optimizations

Efficient MongoDB indexing
Lazy loading of embeddings
Memory consolidation and pruning
Cached context for session continuity

Error Handling

Multiple fallback mechanisms
Graceful degradation when services unavailable
Comprehensive logging for debugging
Backward compatibility maintained

🚀 Advanced Usage

Custom Memory Planning

# Create custom execution plan
execution_plan = {
    "intent": QueryIntent.ENHANCEMENT,
    "strategy": MemoryStrategy.FOCUSED_QA,
    "retrieval_params": {
        "recent_limit": 5,
        "semantic_limit": 10,
        "qa_focus": True,
        "enhancement_mode": True,
        "similarity_threshold": 0.05
    }
}

# Execute custom plan
recent, semantic, metadata = await planner.execute_memory_plan(
    user_id, question, execution_plan, nvidia_rotator
)

Memory Consolidation

# Consolidate and prune memories
consolidation_result = await memory.consolidate_memories(
    user_id="user123", 
    nvidia_rotator=rotator
)

🔄 Integration Points

The memory system integrates seamlessly with:

Chat Routes: Automatic context retrieval
Report Generation: Enhanced instruction processing
File Processing: Relevance detection
User Sessions: Continuity tracking
API Rotators: AI-powered enhancements

📊 Monitoring

The system provides comprehensive metadata:

Intent detection results
Strategy selection rationale
Memory retrieval statistics
Enhancement focus indicators
Session continuity tracking
Performance metrics

This memory system ensures that enhancement requests like "Enhance..." or "Be more detailed" are handled with maximum effectiveness by focusing on past Q&A data and using intelligent memory planning strategies.