API Documentation

Overview

Aigrok provides a powerful Python API for document processing and analysis. The API is designed to be:

Simple to use for basic cases
Flexible for advanced scenarios
Provider-agnostic with consistent interfaces
Well-typed with comprehensive error handling
Highly configurable with automatic model discovery

Installation

pip install aigrok

Quick Start

from aigrok import process_document

# Basic usage
result = process_document("document.pdf", prompt="Summarize the content")
print(result.text)

# Advanced usage with provider selection
result = process_document(
    "document.pdf",
    prompt="Extract key information",
    provider="openai",  # or "ollama"
    model="gpt-4-vision-preview",  # or any available model
    format="json",
    schema={"type": "object", "properties": {...}}
)

Core API

Document Processing

process_document

def process_document(
    file_path: str,
    prompt: Optional[str] = None,
    *,
    provider: Optional[str] = None,  # "openai" or "ollama"
    model: str = "default",
    format: str = "text",
    schema: Optional[Dict[str, Any]] = None,
    stream: bool = False,
    timeout: Optional[int] = None,
    retries: int = 3,
    verbose: bool = False,  # Enable detailed logging
    **model_kwargs: Any
) -> Union[ProcessingResult, AsyncIterator[ProcessingResult]]:
    """Process a document using the specified model.

    Args:
        file_path: Path to the document file
        prompt: Optional processing prompt
        provider: Model provider to use (openai/ollama)
        model: Model name to use for processing
        format: Output format (text/json/markdown)
        schema: JSON schema for structured output
        stream: Enable streaming responses
        timeout: Request timeout in seconds
        retries: Number of retries on failure
        verbose: Enable detailed logging
        **model_kwargs: Additional model-specific arguments

    Returns:
        ProcessingResult or AsyncIterator[ProcessingResult]

    Raises:
        FileNotFoundError: If document file not found
        ValidationError: If schema validation fails
        ConfigurationError: If provider/model not configured
        ProcessingError: If document processing fails
    """

process_documents

async def process_documents(
    file_paths: List[str],
    prompt: Optional[str] = None,
    *,
    max_concurrent: int = 5,
    **kwargs: Any
) -> Dict[str, ProcessingResult]:
    """Process multiple documents concurrently.

    Args:
        file_paths: List of paths to process
        prompt: Optional processing prompt
        max_concurrent: Maximum concurrent operations
        **kwargs: Additional arguments passed to process_document

    Returns:
        Dictionary mapping file paths to results
    """

Configuration

The configuration system supports multiple providers and automatic model discovery:

from aigrok import ConfigManager

# Initialize configuration
config = ConfigManager()

# Configure interactively
config.configure()

# Access configuration
print(config.get_available_models("text"))  # List text models
print(config.get_available_models("vision"))  # List vision models

Config Class

class Config:
    """Configuration management for aigrok."""
    
    @classmethod
    def load(cls, path: Optional[str] = None) -> "Config":
        """Load configuration from file."""
        
    def save(self, path: Optional[str] = None) -> None:
        """Save configuration to file."""
        
    def update(self, **kwargs) -> None:
        """Update configuration values."""
        
    @property
    def text_model(self) -> str:
        """Get current text model."""
        
    @property
    def vision_model(self) -> str:
        """Get current vision model."""

Examples

Basic Examples

See basic_usage.py for complete examples.

Text Extraction

from aigrok import process_document

# Basic text extraction
result = process_document(
    "document.pdf",
    prompt="Extract the main content"
)

if result.success:
    print(f"Content: {result.text}")
    print(f"Pages: {result.page_count}")

Structured Data

# Extract structured data
result = process_document(
    "paper.pdf",
    prompt="Extract paper metadata",
    format="json",
    schema={
        "title": "string",
        "authors": ["string"],
        "publication_date": "string"
    }
)

if result.success:
    metadata = result.metadata
    print(f"Title: {metadata['title']}")

Advanced Examples

See advanced_usage.py for complete examples.

Batch Processing

import asyncio
from aigrok import process_documents

async def process_batch():
    files = ["doc1.pdf", "doc2.pdf", "doc3.pdf"]
    results = await process_documents(
        files,
        prompt="Summarize the content",
        max_concurrent=5
    )
    
    for file_path, result in results.items():
        print(f"{file_path}: {result.text}")

asyncio.run(process_batch())

Streaming Output

async def stream_process():
    async for chunk in process_document(
        "large_doc.pdf",
        prompt="Analyze the content",
        stream=True
    ):
        print(f"Chunk: {chunk.text}")

Provider-Specific Options

# OpenAI
result = process_document(
    "doc.pdf",
    model="gpt-4",
    temperature=0.7,
    max_tokens=2000
)

# Anthropic
result = process_document(
    "doc.pdf",
    model="claude-3",
    max_tokens_to_sample=2000
)

# Gemini
result = process_document(
    "doc.pdf",
    model="gemini-pro",
    candidate_count=3
)

Error Handling

Error Types

class ProcessingError(Exception):
    """Base error for processing failures."""

class ValidationError(Exception):
    """Error for validation failures."""

class ConfigurationError(Exception):
    """Error for configuration issues."""

Error Handling Examples

try:
    result = process_document(
        "large_file.pdf",
        timeout=60,
        retries=3
    )
except ValueError as e:
    print(f"Invalid parameters: {e}")
except TimeoutError:
    print("Processing timed out")
except ProcessingError as e:
    print(f"Processing failed: {e}")

Rate Limiting

The API includes built-in rate limiting to prevent overloading services:

from aigrok import RateLimit

# Configure rate limits
RateLimit.configure(
    requests_per_minute=100,  # Maximum requests per minute
    concurrent_requests=20,   # Maximum concurrent requests
    tokens_per_request=8000   # Maximum tokens per request
)

This is particularly important when:

Processing large batches of documents
Using paid API services
Running in production environments

Logging

Aigrok uses the loguru logger for comprehensive logging:

from loguru import logger

# Enable debug logging
logger.enable("aigrok")

# Process with verbose logging
result = process_document("doc.pdf", verbose=True)

Best Practices

Error Handling: Always handle potential errors, especially for production use
Configuration: Use the Config class for managing settings
Rate Limits: Set appropriate rate limits for your use case
Streaming: Use streaming for large documents
Batching: Use process_documents for multiple files
Schemas: Define schemas for structured output
Models: Choose appropriate models for your task
Testing: Test with sample documents before production use

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

API Documentation

Overview

Installation

Quick Start

Core API

Document Processing

process_document

process_documents

Configuration

Config Class

Examples

Basic Examples

Text Extraction

Structured Data

Advanced Examples

Batch Processing

Streaming Output

Provider-Specific Options

Error Handling

Error Types

Error Handling Examples

Rate Limiting

Rate Limiting

Logging

Best Practices

FilesExpand file tree

api.md

Latest commit

History

api.md

File metadata and controls

API Documentation

Overview

Installation

Quick Start

Core API

Document Processing

process_document

process_documents

Configuration

Config Class

Examples

Basic Examples

Text Extraction

Structured Data

Advanced Examples

Batch Processing

Streaming Output

Provider-Specific Options

Error Handling

Error Types

Error Handling Examples

Rate Limiting

Rate Limiting

Logging

Best Practices