Image2077

首页创作模型库灵感订阅个人中心
登录 / 注册
首页创作模型库灵感订阅个人中心
基准对比热力图 预览图 1
查看原图

Prompt

原始 Prompt

Landscape 16:9 heatmap matrix of models × benchmarks. Columns (rotated 45°): "MMLU", "HumanEval", "GSM8K", "MATH", "BBH", "ARC-C", "HellaSwag", "TruthfulQA". Rows (right-aligned sans-serif): "GPT-4o", "Claude 4.7 Opus", "Gemini 3 Pro", "Llama 4 405B", "Qwen3-Next", "DeepSeek-V3.1", "Mistral-3 Large", "Yi-3 34B", "Phi-4 14B", "OLMo-2 7B". Each cell filled with dusty-teal gradient proportional to score; numeric value in each cell (e.g. "72.3", "88.1"). Best score per column outlined in 1.5px soft-terracotta. Vertical color bar on the right with ticks "0", "25", "50", "75", "100" and label "accuracy (%)". Title: "Benchmark comparison across 10 frontier LLMs". Subtitle: "zero-shot accuracy; best per benchmark outlined in bold. Evaluated March 2026."

科研图示

基准对比热力图

科研图示精选案例,来源 @GPT-Image2-Skill精选 No. 84。

@GPT-Image2-Skill精选
0 收藏

相似案例

基于《基准对比热力图》的分类、风格标签、作者、模型和 Prompt 结构推荐

带误差线的消融柱状图

同分类:科研图示同为图片

多头注意力热力图

同分类:科研图示同为图片

单细胞免疫图谱揭示疗效状态

同分类:科研图示同为图片

Transformer编码器-解码器架构

同分类:科研图示同为图片

多智能体LLM系统架构

同分类:科研图示同为图片

LLM预训练数据混合桑基图

同分类:科研图示同为图片

前沿LLM家族树(2018-2026)

同分类:科研图示同为图片

ReAct推理轨迹图

同分类:科研图示同为图片
带入创作页