feat(M100): Request Payload Size Impact Analysis

## Problem
Users need to understand how prompt size affects inference performance to optimize their workloads.

## Solution
Add `xpyd-bench size-impact` CLI subcommand that sweeps across prompt sizes and measures performance at each level.

## Acceptance Criteria
- `xpyd-bench size-impact --base-url <url> --model <model>` CLI subcommand
- Sweep across prompt sizes (default: 10, 100, 500, 1000, 2000, 4000 tokens)
- Measure TTFT, TPOT, throughput at each prompt size level
- Detect linear vs sublinear vs superlinear scaling behavior
- Report: size-latency curve, inflection points, recommended max prompt size for target latency
- JSON output with per-size-level results
- `--size-levels` to customize sweep sizes
- Tests covering sweep orchestration, scaling detection, and CLI integration

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat(M100): Request Payload Size Impact Analysis #263

Problem

Solution

Acceptance Criteria

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

feat(M100): Request Payload Size Impact Analysis #263

Description

Problem

Solution

Acceptance Criteria

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions