Support for OpenAI’s fine-tuning dataset format (#548)

mirror of https://github.com/ml-explore/mlx-examples.git synced 2025-12-16 02:08:55 +08:00

* LoRA: move load_dataset to tuner/datasets.py file

* LoRA: support OpenAI chat format datasets

see https://platform.openai.com/docs/guides/fine-tuning/example-format

* LoRA: support OpenAI completion format datasets

* LoRA: formatting dataset timing to reduce memory footprint

* Refactor dataset item access in PromptCompletionDataset

* Update mlx_lm/LORA.md

* Update mlx_lm/LORA.md

* check Unsupported data format

* add tests, fine-tune doc

* add tests, fine-tune doc

* add jinja2 for chat template

* nits in readme

* nits in readme

---------

Co-authored-by: Awni Hannun <awni@apple.com>

This commit is contained in:

madroid

2024-03-20 07:45:46 +08:00

committed by

GitHub

parent e05e502c34

commit b0bcd86a40

5 changed files with 231 additions and 44 deletions

1

llms/mlx_lm/requirements.txt

View File

@@ -3,3 +3,4 @@ numpy
 transformers>=4.38.0
 protobuf
 pyyaml
 jinja2

Support for OpenAI’s fine-tuning dataset format (#548)

1 llms/mlx_lm/requirements.txt Unescape Escape View File

1

llms/mlx_lm/requirements.txt

View File