MiniAppBench

community

https://miniappbench.github.io/

MiniAppBench

Activity Feed

AI & ML interests

Agentic Coding

Organization Card

Community About org cards

MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants

Human-AI interaction is evolving from static text responses to dynamic, interactive applications.

MiniAppBench is the first comprehensive benchmark designed to evaluate principle-driven, interactive application generation. While traditional benchmarks focus on static layouts or algorithmic snippets, MiniAppBench shifts the paradigm toward MiniApps—HTML-based applications that require both visual rendering and complex interaction logic.

spaces 2

MiniAppBench Leaderboard

🏅

Submit MiniApp model results and view the leaderboard

models 0

None public yet

datasets 1

MiniAppBench/Dataset

Viewer • Updated Mar 10 • 500 • 34

AI & ML interests

Team members 2

spaces 2 Sort: Recently updated

MiniAppBench Leaderboard

models 0

datasets 1

spaces 2