当前位置：首页 > 每日看点

怎么用自己的数据训练DEEPSEEK？

卡卷网1年前 (2025-03-05)每日看点243

自定义数据训练

准备数据（JSON, CSV, TXT 等格式）
加载数据（使用 datasets.load_dataset() 或 datasets.Dataset.from_pandas()）
格式化数据（使用 map() 处理格式）
使用 SFTTrainer 或 Trainer 进行微调
训练并保存模型

JSON 数据源

[ { "Question": "如何提高睡眠质量？", "Complex_CoT": "1. 保持固定的作息时间，避免熬夜。\n2. 睡前减少手机使用，避免蓝光影响。\n3. 保持适宜的睡眠环境，如黑暗、安静和适宜的温度。\n4. 适当运动，但不要在睡前进行剧烈运动。\n5. 避免摄入过多咖啡因和酒精。", "Response": "要提高睡眠质量，可以建立规律的作息时间，减少电子设备使用，创造舒适的睡眠环境，并保持良好的饮食和运动习惯。" }, { "Question": "如何缓解焦虑情绪？", "Complex_CoT": "1. 进行深呼吸练习，放慢心率。\n2. 进行冥想或瑜伽，放松身心。\n3. 规律运动，如散步或慢跑，提高多巴胺分泌。\n4. 适量减少咖啡因摄入，避免刺激神经系统。\n5. 适当与朋友、家人交流，分享自己的情绪。", "Response": "缓解焦虑的方法包括深呼吸、冥想、运动、减少咖啡因摄入，并与亲友交流情绪。" } ]

2. 加载 JSON 数据

from datasets import load_dataset # 加载本地 JSON 数据集 dataset = load_dataset("json", data_files="/kaggle/input/data-json/data.json", split="train") # 应用格式化 dataset = dataset.map(formatting_prompts_func, batched=True) # 查看处理后的数据集的第一个文本样本 dataset["text"][0]

3. CSV 数据源

import pandas as pd from datasets import Dataset # 加载 CSV 数据 df = pd.read_csv("my_medical_data.csv") # 转换为 Hugging Face Dataset 格式 dataset = Dataset.from_pandas(df) # 应用格式化 dataset = dataset.map(formatting_prompts_func, batched=True) # 查看处理后的数据集的第一个文本样本 dataset["text"][0]

本地部署 DeepSeek

1. 下载 Ollama

https://ollama.com/

安装完成后，控制台执行 CMD 命令，如下截图，即为成功

2. 下载模型

Ollama 官网，下载对应的模型文件

CMD 控制台执行如下命令，即可下载。

默认模型文件，是下载到 C 盘，需要留意磁盘空间。或者添加环境变量，变更模型下载目录（参考配置）

ollama run deepseek-r1:7b

安装完成后（如下图），即可体验

模型调优

https://zhuanlan.zhihu.com/p/24271132165

扫描二维码推送至手机访问。

本文链接：https://www.kajuan.net/ttnews/2025/03/11643.html

分享给朋友：

怎么用自己的数据训练DEEPSEEK？

自定义数据训练

本地部署 DeepSeek

1. 下载 Ollama

2. 下载模型

模型调优

相关文章

为何 Linus 一个人就能写出这么强的系统，中国却做不出来？

都是前端框架，为什么用 React 的人会有优越感？

如何判断 Java 工程师的基础知识是否扎实？

如何看待台积电，三星相继停供大陆7nm及更先进芯片?

腾讯云为何在云服务市场败给了阿里云？

在追求家居美学的过程中，如何选择一款电视机，使其既具备出色的音画质又能与家居装饰相得益彰？

发表评论

Copyright © 2019-2024 www.kajuan.net 版权所有

Powered By Z-BlogPHP. Theme by TOYEAN.

怎么用自己的数据训练DEEPSEEK？

自定义数据训练

本地部署 DeepSeek

1. 下载 Ollama

2. 下载模型

模型调优

相关文章

为何 Linus 一个人就能写出这么强的系统，中国却做不出来？

都是前端框架，为什么用 React 的人会有优越感？

如何判断 Java 工程师的基础知识是否扎实？

如何看待台积电，三星相继停供大陆7nm及更先进芯片?

腾讯云为何在云服务市场败给了阿里云？

在追求家居美学的过程中，如何选择一款电视机，使其既具备出色的音画质又能与家居装饰相得益彰？

发表评论取消回复

Copyright © 2019-2024 www.kajuan.net 版权所有

Powered By Z-BlogPHP. Theme by TOYEAN.

发表评论