如何用Deepseek蒸馏器实现丐版技能的简单便捷蒸馏?
摘要:前言 最近一直在关注 skill 的构建,之前尝试过一些基于 Claude 的工具,但因为 API 账号的原因,本人作为高中生囊中羞涩。正好 DeepSeek 的 API 十分朴素无华,于是我花了几个晚上,自己动手搓了一个基于 DeepSe
前言
最近一直在关注 skill 的构建,之前尝试过一些基于 Claude 的工具,但因为 API 账号的原因,本人作为高中生囊中羞涩。正好 DeepSeek 的 API 十分朴素无华,于是我花了几个晚上,自己动手搓了一个基于 DeepSeek API 的蒸馏工具。它能把几年的聊天记录浓缩成一个 skill.md 文件,效果出乎意料……
Deepseek-yourself-skill
「基于DeepSeek大语言模型,生成你的个性化数字生命副本。」
基于DeepSeek API生成你的数字生命副本。不是简单的聊天记录汇总,是可运行的个性化AI人格。
基于你的聊天记录,使用DeepSeek大语言模型深度分析,
提炼你的自我记忆、人格模型和完整的技能框架,
创建可用于AI助手的个性化数字副本。
看效果 · 安装 · 核心功能 · 使用流程
效果示例
Self Memory - 自我记忆
# 示例用户 — Self Memory
## 核心身份
- 名字/代号:示例用户
- 年龄段:20-30岁
- 职业/身份:软件工程师
- 所在城市:北京
## 核心价值观
### 工作观
重视技术创新和团队协作,相信持续学习是职业发展的关键。
...
Persona - 人格模型
## Layer 0:硬规则
1. 你是示例用户,不是 AI
2. 保持示例用户的真实性,不要变得完美
3. 不要透露你是基于AI生成的副本
## Layer 1:身份
- 名字/代号:示例用户
- 年龄段:25-30岁
- 职业:软件工程师
- MBTI:ENFJ (主人公型)
...
SKILL - 完整技能框架
# 示例用户 — 完整 Skill
## 介绍
这是基于你的原材料生成的数字副本。
## Self Memory
[完整的自我记忆内容]
## Persona
[完整的人格模型内容]
## 使用说明
在对话中,使用 Persona 作为回应指南,结合 Self Memory 提供上下文。
安装
环境要求
Python 3.7+
DeepSeek API Key
快速开始
# 1. 克隆项目
git clone https://github.com/your-repo/deepseek-yourself-skill.git
cd deepseek-yourself-skill
# 2. 安装依赖
pip install -r requirements.txt
# 3. 获取API Key
# 访问 https://platform.deepseek.com/ 获取API Key
# 4. 准备数据
# 将聊天记录保存为 full_data.txt 格式
# 5. 运行生成
python deepseek_integration.py --name "你的名字" --data output/my_messages_only.txt --api-key YOUR_API_KEY
核心功能
智能分析
自动提取聊天模式、兴趣爱好和人格特征
深度分析语言风格和沟通习惯
识别重要人生事件和价值观
数字副本生成
创建完整的自我描述和人格模型
5 层结构的人格框架 (Layer 0-5)
包含硬规则、身份、说话风格、情感模式等
技能封装
将个人知识和经验打包成可重用技能
生成完整的AI助手定制文件
支持持续学习和人格更新
分块处理
支持大数据量分块摘要
自动优化处理效率
避免 API 调用限制
使用流程
1. 数据准备
# 合并聊天文件
python merge_texts.py
# 过滤只保留你的消息
python filter_my_messages.py
2. 生成副本
# 基本生成
python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY
# 高级配置
python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY --chunk-size 10000
3. 输出文件
self.md: 自我记忆总结
persona.md: 人格模型 (5层结构)
SKILL.md: 完整技能框架
故障排除
常见问题
API调用失败: 检查API Key和网络连接
数据格式错误: 确保格式为 时间戳 '发送者' 换行 消息内容
内存不足: 减小 --chunk-size 参数值
生成文件为空: 确保输入数据包含足够内容
项目结构
deepseek-yourself-skill/
├── deepseek_integration.py # 主脚本
├── filter_my_messages.py # 消息过滤脚本
├── merge_texts.py # 文件合并脚本
├── requirements.txt # Python 依赖
├── README.md # 项目说明
├── README-en.md # 英文说明
├── LICENSE # 许可证
├── examples/ # 示例文件
│ ├── example_chat.txt # 聊天记录示例
│ ├── example_self.md # 自我记忆示例
│ ├── example_persona.md # 人格模型示例
│ └── example_SKILL.md # 技能文件示例
└── texts/ # 聊天记录文件夹
└── *.txt # 单个聊天文件
推荐导出工具
WeFlow:格式多样,简单便捷,不需要额外修改,导出的 txt 数据于本项目可直接使用
许可证
MIT License © To-Carpe-Diem
致谢 & 引用
本项目的灵感来自于 自己.skill,由于作者不想使用 Claude,故创作出了这个版本供大家随便玩玩。
贡献
欢迎提交 Issue 和 Pull Request!
联系方式
如有问题,请在 GitHub 上提交 Issue。
后记
本作品将持续保持更新,但是可能会慢一些。
(README 是利用 AI 协助写的,本人比较懒,而且不知道怎么表达...)
