Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 1 hour ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-muon-ckpt4

nm-research published a model about 1 hour ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-muon-ckpt4

krishnateja95 updated a model about 2 hours ago

inference-optimization/Qwen3-8B-FP8-Dynamic

View all activity

Collections 2

models 180

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-muon-ckpt4

2B • Updated about 1 hour ago

inference-optimization/Qwen3-8B-FP8-Dynamic

Text Generation • 8B • Updated about 2 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.fullattn-qwen235b-instruct-bs16-ckpt0

2B • Updated about 20 hours ago

inference-optimization/dflash-DeepSeek-V4-Flash-swa-muon-speculators-50k

2B • Updated 2 days ago • 121

inference-optimization/dflash-DeepSeek-V4-Flash-all-swa-muon-speculators-50k

2B • Updated 2 days ago • 94 • 1

inference-optimization/Qwen3.5-397B-A17B-FP8-dynamic-data-subset-speculator.dflash

2B • Updated 3 days ago • 16

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle31-fcnorm-ckpt1

1B • Updated 3 days ago • 27

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt4

2B • Updated 5 days ago • 23

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle31-qwen3arch-3e4-ckpt1

1B • Updated 5 days ago • 14

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt3

2B • Updated 6 days ago • 226

View 180 models

datasets 26

inference-optimization/every-eval-ever-demo

Viewer • Updated 13 days ago • 1 • 58

inference-optimization/DeepSeek-V4-Flash-responses

Viewer • Updated 13 days ago • 508k • 49

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated 19 days ago • 7.47k • 100

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated 25 days ago • 7.47k • 159

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated 25 days ago • 7.67k • 67

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated 27 days ago • 252

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated 27 days ago • 70

inference-optimization/gpt-oss-120b-responses

Preview • Updated 27 days ago • 20

inference-optimization/Qwen3-32B-responses

Preview • Updated 27 days ago • 54

inference-optimization/ctest-Qwen3.6-27B-speculator-dataset

Viewer • Updated May 28 • 5.61k • 51 • 1

View 26 datasets