Spaces:

joaogante
/

medusa-maker

Paused

joaogante HF staff commited on Jan 6

Commit

4f9f282

•

1 Parent(s): e725b2a

FA2

Files changed (3) hide show

requirements.txt CHANGED Viewed

src/calibration_datasets.py CHANGED Viewed

@@ -15,7 +15,6 @@ class CalibrationDataset(ABC):
     dataset_config: dict
     dataset: str
     dataset_name: str
-    dataset_limit: int = int(1e7)
     # Defines the field to extract from the HF dataset
     # If specified, just this field will be returned, and no transformation will be done.
@@ -125,7 +124,7 @@ class CalibrationDataset(ABC):
         print(f"Loading HF dataset {path} with params: {kwargs}")
         data: Dataset = load_dataset(path=path, streaming=True, **kwargs)
-        return data.shuffle().take(limit)
     @staticmethod
     def list_with_nls(samples: List[str]) -> List[str]:
@@ -152,11 +151,11 @@ class CalibrationDataset(ABC):
         """
         # Load HF dataset. Subclasses provide HF dataset details in `dataset_config`
         if not self.data:
-            self.data = self.get_hf_dataset(**self.dataset_config, limit=self.dataset_limit)
         if not self.samples:
             if hasattr(self, "dataset_field") and self.dataset_field:
-                samples = self.data[self.dataset_field]
             else:
                 try:
                     samples = self.process_samples()
@@ -222,11 +221,11 @@ class WikitextDataset(CalibrationDataset):
     }
     dataset_name = "Wikitext103 Full"
-    # def process_samples(self) -> List[str]:
-    #     return [
-    #         "\n" if len(item) == 0 else item
-    #         for item in self.data["text"]
-    #     ]
 class C4Dataset(CalibrationDataset):

     dataset_config: dict
     dataset: str
     dataset_name: str
     # Defines the field to extract from the HF dataset
     # If specified, just this field will be returned, and no transformation will be done.
         print(f"Loading HF dataset {path} with params: {kwargs}")
         data: Dataset = load_dataset(path=path, streaming=True, **kwargs)
+        return iter(data.shuffle().take(limit))
     @staticmethod
     def list_with_nls(samples: List[str]) -> List[str]:
         """
         # Load HF dataset. Subclasses provide HF dataset details in `dataset_config`
         if not self.data:
+            self.data = self.get_hf_dataset(**self.dataset_config, limit=self.num_samples*10)
         if not self.samples:
             if hasattr(self, "dataset_field") and self.dataset_field:
+                samples = [data[self.dataset_field] for data in self.data]
             else:
                 try:
                     samples = self.process_samples()
     }
     dataset_name = "Wikitext103 Full"
+    def process_samples(self) -> List[str]:
+        return [
+            "\n" if len(item) == 0 else item
+            for item in self.data["text"]
+        ]
 class C4Dataset(CalibrationDataset):

src/medusa_training_script.py CHANGED Viewed

@@ -192,16 +192,29 @@ def train():
     )
     # Load model and tokenizer
-    model = transformers.AutoModelForCausalLM.from_pretrained(
-        model_args.model_name_or_path,
-        config=config,
-        cache_dir=training_args.cache_dir,
-        low_cpu_mem_usage=True,
-        torch_dtype=torch.bfloat16,
-        quantization_config=quantization_config if model_args.load_in_4bit else None,
-        load_in_4bit=model_args.load_in_4bit,
-        load_in_8bit=model_args.load_in_8bit,
-    )
     # Freeze the base model
     for param in model.base_model.parameters():

     )
     # Load model and tokenizer
+    try:  # Try loading with FA2
+        model = transformers.AutoModelForCausalLM.from_pretrained(
+            model_args.model_name_or_path,
+            config=config,
+            cache_dir=training_args.cache_dir,
+            low_cpu_mem_usage=True,
+            torch_dtype=torch.bfloat16,
+            quantization_config=quantization_config if model_args.load_in_4bit else None,
+            load_in_4bit=model_args.load_in_4bit,
+            load_in_8bit=model_args.load_in_8bit,
+            attn_implementation="flash_attention_2",
+        )
+    except:
+        model = transformers.AutoModelForCausalLM.from_pretrained(
+            model_args.model_name_or_path,
+            config=config,
+            cache_dir=training_args.cache_dir,
+            low_cpu_mem_usage=True,
+            torch_dtype=torch.bfloat16,
+            quantization_config=quantization_config if model_args.load_in_4bit else None,
+            load_in_4bit=model_args.load_in_4bit,
+            load_in_8bit=model_args.load_in_8bit,
+        )
     # Freeze the base model
     for param in model.base_model.parameters():