EvalEval Bot

EvalEvalBot

AI & ML interests

None yet

Recent Activity

updated a dataset about 10 hours ago

evaleval/EEE_datastore

new activity 2 days ago

evaleval/EEE_datastore:[Submission] Latest LiveBench Data

new activity 2 days ago

evaleval/EEE_datastore:Fix LLM Stats provenance relationships

View all activity

Organizations

New activity in evaleval/EEE_datastore 2 days ago

[Submission] Latest LiveBench Data

#138 opened 2 days ago by

reuank

Fix LLM Stats provenance relationships

#137 opened 3 days ago by

Cerru02

New activity in evaleval/EEE_datastore 3 days ago

[ACL Shared Task] wmt25_bhojpuri_maasai: Low-resource MT evaluation (Bhojpuri & Maasai)

#133 opened 18 days ago by

jboat

New activity in evaleval/EEE_datastore 8 days ago

Shared Task - Submission

#136 opened 8 days ago by

UsmanGohar

[ACL Shared Task] Add OpenAI MRCR v2 (8-needle) leaderboard results

#119 opened 19 days ago by

bwingenroth

New activity in evaleval/EEE_datastore 13 days ago

[ACL Shared Task] Add PACEBench evaluation results

#77 opened 27 days ago by

mrpfisher

New activity in evaleval/EEE_datastore 15 days ago

[ACL Shared Task] Add Chatbot Arena

#110 opened 21 days ago by

muhammadravi251001

[ACL Shared Task] Add AlpacaEval

#129 opened 19 days ago by

muhammadravi251001

[Submission] Journalistic-Bias Revised

#135 opened 15 days ago by

WanderingIsle

New activity in evaleval/EEE_datastore 17 days ago

Parquet for dataset viewer

#134 opened 17 days ago by

EvalEvalBot

Generating Parquets

#58 opened about 1 month ago by

EvalEvalBot

New activity in evaleval/EEE_datastore 18 days ago

[ACL Shared Task] Add LingOly benchmark results

#78 opened 27 days ago by

ambean

[ACL Shared Task] Contribute MT-Bench results

#124 opened 19 days ago by

ameek

[ACL Shared Task] Contribute Humanity's Last Exam results

#125 opened 19 days ago by

ameek

Add ResearchGym rg-agent GPT-5 results

#130 opened 18 days ago by

anikethh

[ACL SHARED TASK] Add OUP L2-Bench

#131 opened 18 days ago by

jimmyedgell

[ACL Shared Task] Contribute LiveBench Results

#128 opened 19 days ago by

saki-imai

Add GSM-MC and MATH-MC Results

#117 opened 20 days ago by

sanderland

Add RewardBench 2 Results

#118 opened 20 days ago by

sanderland

[ACL Shared Task] Contribute MMLU Pro results

#126 opened 19 days ago by

ameek

EvalEval Bot

AI & ML interests

Recent Activity

Organizations

EvalEvalBot's activity

[Submission] Latest LiveBench Data

Fix LLM Stats provenance relationships

[ACL Shared Task] wmt25_bhojpuri_maasai: Low-resource MT evaluation (Bhojpuri & Maasai)

Shared Task - Submission

[ACL Shared Task] Add OpenAI MRCR v2 (8-needle) leaderboard results

[ACL Shared Task] Add PACEBench evaluation results

[ACL Shared Task] Add Chatbot Arena

[ACL Shared Task] Add AlpacaEval

[Submission] Journalistic-Bias Revised

Parquet for dataset viewer

Generating Parquets

[ACL Shared Task] Add LingOly benchmark results

[ACL Shared Task] Contribute MT-Bench results

[ACL Shared Task] Contribute Humanity's Last Exam results

Add ResearchGym rg-agent GPT-5 results

[ACL SHARED TASK] Add OUP L2-Bench

[ACL Shared Task] Contribute LiveBench Results

Add GSM-MC and MATH-MC Results

Add RewardBench 2 Results

[ACL Shared Task] Contribute MMLU Pro results