AI Categorization

The Email Assistant uses Google Gemini AI to intelligently categorize incoming emails, helping you focus on what matters most.

How It Works

Email Categories

Category	Description	Examples
Need-Action	Requires your response	Meeting invites, direct questions
FYI	Informational only	Status updates, notifications
Newsletter	Subscriptions	Daily digests, weekly updates
Promotional	Marketing content	Sales, offers, advertisements
Social	Social networks	LinkedIn, Twitter notifications

Categorization Logic

Input Processing

The system extracts key information from each email:

email_data = {
    'subject': email['subject'],
    'from': email['from'],
    'snippet': email['snippet'],  # First 100 chars
    'date': email['date'],
}

AI Prompt

CATEGORIZATION_PROMPT = """
Analyze this email and categorize it:

From: {from_address}
Subject: {subject}
Preview: {snippet}

Categories:
1. NEED_ACTION - Requires response or action
2. FYI - Informational, no action needed
3. NEWSLETTER - Subscription content
4. PROMOTIONAL - Marketing/sales
5. SOCIAL - Social network notifications

Return ONLY the category name.
"""

Response Parsing

def parse_category(response: str) -> str:
    """Parse Gemini response to category."""
    response = response.strip().upper()

    categories = {
        'NEED_ACTION': 'Need-Action',
        'FYI': 'FYI',
        'NEWSLETTER': 'Newsletter',
        'PROMOTIONAL': 'Promotional',
        'SOCIAL': 'Social',
    }

    for key, value in categories.items():
        if key in response:
            return value

    return 'FYI'  # Default fallback

Gemini Configuration

Model Settings

{
  "api_settings": {
    "gemini_model": "gemini-2.5-flash-lite",
    "requests_per_minute": 30,
    "max_retries": 3,
    "timeout_seconds": 30
  }
}

Rate Limiting

The system respects API rate limits:

class RateLimiter:
    def __init__(self, requests_per_minute: int = 30):
        self.requests_per_minute = requests_per_minute
        self.request_times = []

    def wait_if_needed(self):
        """Wait if rate limit would be exceeded."""
        now = time.time()
        minute_ago = now - 60

        # Remove old requests
        self.request_times = [t for t in self.request_times if t > minute_ago]

        if len(self.request_times) >= self.requests_per_minute:
            sleep_time = self.request_times[0] - minute_ago
            time.sleep(sleep_time)

        self.request_times.append(now)

Caching

Categorization results are cached to minimize API calls:

Cache Configuration

{
  "cache_settings": {
    "enabled": true,
    "max_cached_emails": 30,
    "cache_expiry_hours": 24
  }
}

Cache Benefits

Metric	First Run	Cached Run
API Calls	10-15	0-3
Time	13-20 sec	5-8 sec
Cost	~$0.10	~$0.00

Error Handling

Retry Logic

def categorize_with_retry(email: dict, max_retries: int = 3) -> str:
    """Categorize email with retry on failure."""
    for attempt in range(max_retries):
        try:
            return call_gemini_api(email)
        except RateLimitError:
            wait_time = 2 ** attempt  # Exponential backoff
            time.sleep(wait_time)
        except APIError as e:
            logger.error(f"API error: {e}")
            if attempt == max_retries - 1:
                return 'FYI'  # Default on failure

    return 'FYI'

Fallback Behavior

If Gemini API fails:

Log the error
Return default category (FYI)
Continue processing other emails
Report error in metrics

Accuracy Improvements

Tips for Better Categorization

Complete metadata: Ensure subject and snippet are available
Consistent senders: Known senders improve accuracy
Clean inbox: Reduce spam before processing
Tune prompts: Adjust prompts for your use case

Common Misclassifications

Situation	Expected	Common Mistake	Fix
Meeting invite	Need-Action	FYI	Check for "invite" keyword
Bill reminder	Need-Action	Newsletter	Check sender domain
Product update	Newsletter	Promotional	Check subject patterns

Metrics

Track categorization performance:

# Tracked metrics
metrics.record_api_call(
    model='gemini-2.5-flash-lite',
    latency=elapsed_time,
    success=True,
    category=result,
)

View in dashboard:

API calls made
Response times
Category distribution
Error rates

How It Works​

Email Categories​

Categorization Logic​

Input Processing​

AI Prompt​

Response Parsing​

Gemini Configuration​

Model Settings​

Rate Limiting​

Caching​

Cache Configuration​

Cache Benefits​

Error Handling​

Retry Logic​

Fallback Behavior​

Accuracy Improvements​

Tips for Better Categorization​

Common Misclassifications​

Metrics​

Related Documentation​