hermes-agent

mirror of https://github.com/NousResearch/hermes-agent.git synced 2026-07-03 12:23:08 +00:00

History

Teknium d6e1fadbf5 fix(xai): omit reasoning.effort for grok models that reject it (#23435 ) xAI's Responses API returns HTTP 400 ("Model X does not support parameter reasoningEffort") for grok-4, grok-4-0709, grok-4-fast-, grok-4-1-fast-, grok-3, grok-4.20-0309-, and grok-code-fast-1 — even though those models reason natively. Hermes was unconditionally sending `reasoning: {effort: 'medium'}` to xAI for every Grok model, breaking direct `--provider xai` for the entire grok-4 line. Add a substring allowlist predicate (verified live against api.x.ai 2026-05-10) covering the only Grok families that accept the effort dial: grok-3-mini, grok-4.20-multi-agent, grok-4.3. The Responses transport omits the `reasoning` key entirely for everything else while still including `reasoning.encrypted_content` so we capture native reasoning tokens. Verified end-to-end: `hermes chat -q hi --provider xai --model grok-4-0709` went from HTTP 400 to a successful reply.		2026-05-10 15:21:30 -07:00
..
__init__.py	feat: add transport types + migrate Anthropic normalize path	2026-04-20 23:06:00 -07:00
test_bedrock_transport.py	fix(bedrock): preserve reasoningContent across converse normalization	2026-05-07 05:17:16 -07:00
test_chat_completions.py	feat(openrouter): wire Pareto Code router with min_coding_score knob (#22838 )	2026-05-09 14:47:00 -07:00
test_codex_transport.py	fix(xai): omit reasoning.effort for grok models that reject it (#23435 )	2026-05-10 15:21:30 -07:00
test_transport.py	fix(agent): preserve Codex message items for replay	2026-04-25 18:22:06 -07:00
test_types.py	fix(agent): preserve Codex message items for replay	2026-04-25 18:22:06 -07:00