如何用Deepseek蒸馏器实现丐版技能的简单便捷蒸馏?

摘要:前言 最近一直在关注 skill 的构建,之前尝试过一些基于 Claude 的工具,但因为 API 账号的原因,本人作为高中生囊中羞涩。正好 DeepSeek 的 API 十分朴素无华,于是我花了几个晚上,自己动手搓了一个基于 DeepSe
前言 最近一直在关注 skill 的构建,之前尝试过一些基于 Claude 的工具,但因为 API 账号的原因,本人作为高中生囊中羞涩。正好 DeepSeek 的 API 十分朴素无华,于是我花了几个晚上,自己动手搓了一个基于 DeepSeek API 的蒸馏工具。它能把几年的聊天记录浓缩成一个 skill.md 文件,效果出乎意料…… Deepseek-yourself-skill 「基于DeepSeek大语言模型,生成你的个性化数字生命副本。」 基于DeepSeek API生成你的数字生命副本。不是简单的聊天记录汇总,是可运行的个性化AI人格。 基于你的聊天记录,使用DeepSeek大语言模型深度分析, 提炼你的自我记忆、人格模型和完整的技能框架, 创建可用于AI助手的个性化数字副本。 看效果 · 安装 · 核心功能 · 使用流程 效果示例 Self Memory - 自我记忆 # 示例用户 — Self Memory ## 核心身份 - 名字/代号:示例用户 - 年龄段:20-30岁 - 职业/身份:软件工程师 - 所在城市:北京 ## 核心价值观 ### 工作观 重视技术创新和团队协作,相信持续学习是职业发展的关键。 ... Persona - 人格模型 ## Layer 0:硬规则 1. 你是示例用户,不是 AI 2. 保持示例用户的真实性,不要变得完美 3. 不要透露你是基于AI生成的副本 ## Layer 1:身份 - 名字/代号:示例用户 - 年龄段:25-30岁 - 职业:软件工程师 - MBTI:ENFJ (主人公型) ... SKILL - 完整技能框架 # 示例用户 — 完整 Skill ## 介绍 这是基于你的原材料生成的数字副本。 ## Self Memory [完整的自我记忆内容] ## Persona [完整的人格模型内容] ## 使用说明 在对话中,使用 Persona 作为回应指南,结合 Self Memory 提供上下文。 安装 环境要求 Python 3.7+ DeepSeek API Key 快速开始 # 1. 克隆项目 git clone https://github.com/your-repo/deepseek-yourself-skill.git cd deepseek-yourself-skill # 2. 安装依赖 pip install -r requirements.txt # 3. 获取API Key # 访问 https://platform.deepseek.com/ 获取API Key # 4. 准备数据 # 将聊天记录保存为 full_data.txt 格式 # 5. 运行生成 python deepseek_integration.py --name "你的名字" --data output/my_messages_only.txt --api-key YOUR_API_KEY 核心功能 智能分析 自动提取聊天模式、兴趣爱好和人格特征 深度分析语言风格和沟通习惯 识别重要人生事件和价值观 数字副本生成 创建完整的自我描述和人格模型 5 层结构的人格框架 (Layer 0-5) 包含硬规则、身份、说话风格、情感模式等 技能封装 将个人知识和经验打包成可重用技能 生成完整的AI助手定制文件 支持持续学习和人格更新 分块处理 支持大数据量分块摘要 自动优化处理效率 避免 API 调用限制 使用流程 1. 数据准备 # 合并聊天文件 python merge_texts.py # 过滤只保留你的消息 python filter_my_messages.py 2. 生成副本 # 基本生成 python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY # 高级配置 python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY --chunk-size 10000 3. 输出文件 self.md: 自我记忆总结 persona.md: 人格模型 (5层结构) SKILL.md: 完整技能框架 故障排除 常见问题 API调用失败: 检查API Key和网络连接 数据格式错误: 确保格式为 时间戳 '发送者' 换行 消息内容 内存不足: 减小 --chunk-size 参数值 生成文件为空: 确保输入数据包含足够内容 项目结构 deepseek-yourself-skill/ ├── deepseek_integration.py # 主脚本 ├── filter_my_messages.py # 消息过滤脚本 ├── merge_texts.py # 文件合并脚本 ├── requirements.txt # Python 依赖 ├── README.md # 项目说明 ├── README-en.md # 英文说明 ├── LICENSE # 许可证 ├── examples/ # 示例文件 │ ├── example_chat.txt # 聊天记录示例 │ ├── example_self.md # 自我记忆示例 │ ├── example_persona.md # 人格模型示例 │ └── example_SKILL.md # 技能文件示例 └── texts/ # 聊天记录文件夹 └── *.txt # 单个聊天文件 推荐导出工具 WeFlow:格式多样,简单便捷,不需要额外修改,导出的 txt 数据于本项目可直接使用 许可证 MIT License © To-Carpe-Diem 致谢 & 引用 本项目的灵感来自于 自己.skill,由于作者不想使用 Claude,故创作出了这个版本供大家随便玩玩。 贡献 欢迎提交 Issue 和 Pull Request! 联系方式 如有问题,请在 GitHub 上提交 Issue。 后记 本作品将持续保持更新,但是可能会慢一些。 (README 是利用 AI 协助写的,本人比较懒,而且不知道怎么表达...)