小红书AI图文生成器-红墨功能,如何实现优化?
摘要:本文介绍了小红书的一键图文生成平台,并提供了系统的基本执行流程及原理。同时分享了本人基于本地部署后,生成的图文效果,眼过千遍不如手过一遍,实践方能出真知。
1. 背景
花了近一周时间,深入研究了Github近几天比较有意思的一个项目,小红书AI图文生成器RedInk。仅需输入一个主题以及可选的参考图片,系统则会自动生成大纲,然后针对每个章节生成对应的图片。
项目前端采用Vue+TypeScript,后端采用Flask。
支持docker部署及编译部署,文本模型及图像模型支持系统编辑。
Ps: 国内有哪些平台可以访问nano banana 2 pro? 本人使用的是七牛,免费试用额度还不少哦。
2. 系统效果
模型选择: Qwen3-14B大语言模型,Nano Banana2生图模型。
输入: 3岁宝宝冬季保暖攻略
输出效果:
3. 整体流程
(1) 用户通过系统输入关注的主题,也可同时上传参考的多个图片
(2) 系统会调用LLM生成大纲,包含封面、多个内容片段以及总结,如果针对生成效果不满意,可以直接在线编辑。
(3) 编辑好每个段落后,即可开始一键生图,可根据服务商模型特性,采用串行及并行两种方式。
(4) 生成好的图片后,如果针对其中某些不满意,可以执行重新生成,最终可以一键生成。
4. 代码浅析
(1) 前后端代码的可读性很强,建议可以本地进行调试。
