Hermes 4 - Llama-3.1 405B (Reasoning)

Last updated: Recently

Model Type

Text

Max Context

Max Output

Parameter Scale

Hermes 4 Llama 3.1 405B Reasoning by Nous Research: Text model; TTFT 0.745s, 34.5 tok/s.

Input Modality

Output Modality

Inference Speed

34.521 tokens/s

Latest Release Date

8/27/2025

SDK Ecosystem

artificial-analysismanufactureraa-bootstrap

Model Overview Fields

name

Hermes 4 - Llama-3.1 405B (Reasoning)

Release date

8/27/2025

Performance

34.521 tokens/s

model_creator.name

Nous Research

AA Evaluation Scores

AA Intelligence Index

18.6

AA Coding Index

AA Math Index

69.7

MMLU Pro

0.829

GPQA

0.727

HLE

0.103

LiveCodeBench

0.686

SciCode

0.252

Math-500

AIME

AIME 2025

0.697

IFBench

0.327

LCR

0.207

TerminalBench Hard

0.114

TAU2

0.222

Output Speed (tokens/s)

34.521 tok/s

TTFT (s)

0.745s

First Answer Token (s)

58.68s

Nous Research

◎

Hermes 4 - Llama-3.1 405B (Reasoning)

$1.00/M$3.00/M

Hermes 4 Llama 3.1 405B Reasoning by Nous Research: Text model; TTFT 0.745s, 34.5 tok/s.

There are no reviews for this model yet.

artificial-analysismanufactureraa-bootstrap

0.0