bigcode
/

santacoder

@@ -20,38 +20,39 @@ model-index:
   - task:
       type: text-generation
     dataset:
-      type: openai_humaneval
-      name: HumanEval (Python)
     metrics:
     - name: pass@1
       type: pass@1
-      value: 0.0
       verified: false
     - name: pass@10
       type: pass@10
-      value: 0.0
       verified: false
     - name: pass@100
       type: pass@100
-      value: 0.0
       verified: false
   - task:
       type: text-generation
     dataset:
       type: nuprl/MultiPL-E
-      name: MultiPL HumanEval (Java)
     metrics:
     - name: pass@1
       type: pass@1
-      value: 0.0
       verified: false
     - name: pass@10
       type: pass@10
-      value: 0.0
       verified: false
     - name: pass@100
       type: pass@100
-      value: 0.41
   - task:
       type: text-generation
     dataset:
@@ -60,67 +61,70 @@ model-index:
     metrics:
     - name: pass@1
       type: pass@1
-      value: 0.0
       verified: false
     - name: pass@10
       type: pass@10
-      value: 0.0
       verified: false
     - name: pass@100
       type: pass@100
       value: 0.47
   - task:
       type: text-generation
     dataset:
-      type: openai_humaneval
-      name: MBPP (Python)
     metrics:
     - name: pass@1
       type: pass@1
-      value: 0.0
       verified: false
     - name: pass@10
       type: pass@10
-      value: 0.0
       verified: false
     - name: pass@100
       type: pass@100
-      value: 0.49
       verified: false
   - task:
       type: text-generation
     dataset:
       type: nuprl/MultiPL-E
-      name: MultiPL MBPP (Java)
     metrics:
     - name: pass@1
       type: pass@1
-      value: 0.0
       verified: false
     - name: pass@10
       type: pass@10
-      value: 0.0
       verified: false
     - name: pass@100
       type: pass@100
-      value: 0.0
   - task:
       type: text-generation
     dataset:
       type: nuprl/MultiPL-E
-      name: MultiPL MBPP (JavaScript)
     metrics:
     - name: pass@1
       type: pass@1
-      value: 0.0
       verified: false
     - name: pass@10
       type: pass@10
-      value: 0.0
       verified: false
     - name: pass@100
       type: pass@100
-      value: 0.0
   - task:
       type: text-generation
     dataset:

   - task:
       type: text-generation
     dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL HumanEval (Python)
     metrics:
     - name: pass@1
       type: pass@1
+      value: 0.18
       verified: false
     - name: pass@10
       type: pass@10
+      value: 0.29
       verified: false
     - name: pass@100
       type: pass@100
+      value: 0.49
       verified: false
   - task:
       type: text-generation
     dataset:
       type: nuprl/MultiPL-E
+      name: MultiPL MBPP (Python)
     metrics:
     - name: pass@1
       type: pass@1
+      value: 0.35
       verified: false
     - name: pass@10
       type: pass@10
+      value: 0.58
       verified: false
     - name: pass@100
       type: pass@100
+      value: 0.77
+      verified: false
   - task:
       type: text-generation
     dataset:
     metrics:
     - name: pass@1
       type: pass@1
+      value: 0.16
       verified: false
     - name: pass@10
       type: pass@10
+      value: 0.27
       verified: false
     - name: pass@100
       type: pass@100
       value: 0.47
+      verified: false
   - task:
       type: text-generation
     dataset:
+      type: nuprl/MultiPL-E
+      name: MultiPL MBPP (Javascript)
     metrics:
     - name: pass@1
       type: pass@1
+      value: 0.28
       verified: false
     - name: pass@10
       type: pass@10
+      value: 0.51
       verified: false
     - name: pass@100
       type: pass@100
+      value: 0.70
       verified: false
   - task:
       type: text-generation
     dataset:
       type: nuprl/MultiPL-E
+      name: MultiPL HumanEval (Java)
     metrics:
     - name: pass@1
       type: pass@1
+      value: 0.15
       verified: false
     - name: pass@10
       type: pass@10
+      value: 0.26
       verified: false
     - name: pass@100
       type: pass@100
+      value: 0.41
+      verified: false
   - task:
       type: text-generation
     dataset:
       type: nuprl/MultiPL-E
+      name: MultiPL MBPP (Java)
     metrics:
     - name: pass@1
       type: pass@1
+      value: 0.28
       verified: false
     - name: pass@10
       type: pass@10
+      value: 0.44
       verified: false
     - name: pass@100
       type: pass@100
+      value: 0.59
+      verified: false
   - task:
       type: text-generation
     dataset: