操作系统及版本
linux-aarch64
安装工具的python环境
docker容器中的python环境
python版本
3.11
AISBench工具版本
3.1.20260429
AISBench执行命令
ais_bench --models vllm_api_general_chat_custom --datasets aime2025_gen_0_shot_chat_prompt --debug
模型配置文件或自定义配置文件内容
Deepseekv3.2-w8a8
from ais_bench.benchmark.models import VLLMCustomAPIChat
from ais_bench.benchmark.utils.postprocess.model_postprocessors import extract_non_reasoning_content
models = [
dict(
attr="service",
type=VLLMCustomAPIChat,
abbr="vllm-api-stream-chat",
path="/root/DeepSeek-V3___2-W8A8",
model="ds32",
stream=True,
request_rate=11.2,
use_timestamp=False,
retry=2,
api_key="",
host_ip="localhost",
host_port=48043,
url="",
max_out_len=1500,
batch_size=1,
trust_remote_code=True,
generation_kwargs=dict(
temperature=0,
ignore_eos=True,
),
pred_postprocessor=dict(type=extract_non_reasoning_content),
)
]
预期行为
No response
实际行为
前置检查
操作系统及版本
linux-aarch64
安装工具的python环境
docker容器中的python环境
python版本
3.11
AISBench工具版本
3.1.20260429
AISBench执行命令
ais_bench --models vllm_api_general_chat_custom --datasets aime2025_gen_0_shot_chat_prompt --debug
模型配置文件或自定义配置文件内容
Deepseekv3.2-w8a8
from ais_bench.benchmark.models import VLLMCustomAPIChat
from ais_bench.benchmark.utils.postprocess.model_postprocessors import extract_non_reasoning_content
models = [
dict(
attr="service",
type=VLLMCustomAPIChat,
abbr="vllm-api-stream-chat",
path="/root/DeepSeek-V3___2-W8A8",
model="ds32",
stream=True,
request_rate=11.2,
use_timestamp=False,
retry=2,
api_key="",
host_ip="localhost",
host_port=48043,
url="",
max_out_len=1500,
batch_size=1,
trust_remote_code=True,
generation_kwargs=dict(
temperature=0,
ignore_eos=True,
),
pred_postprocessor=dict(type=extract_non_reasoning_content),
)
]
预期行为
No response
实际行为
前置检查