25 5 月 2026

Deepseek使用指南-常用提示词模版

效率是市场竞争的基石，当AI这个高效的工具出现时，会更大的提高我们的生产效率，那让AI如何为我们日常工作赋能呢？今天给大家分享一下用Deepseek 的一些小方法，希望可以帮助到大家。生成思维导图

1.信息整合：（XX就是我们实际使用时需要查找的信息，这里我就用XX代替啦）

提示词：整合一下XX关于XX的相关信息，同时提取XX中的关键词

Deepseek：输出···

2.结构化设计

提示词：对上面的信息进行结构化呈现

Deepseek：输出···

3.可视化表达

提示词：把上面的内容用Markdown格式生成

Deepseek：输出···

把上面的结果复制到TXT文件中并保存，把文件后缀.txt修改为.md

打开Xmind，导入刚才的Markdown文件，导入后，上面结构化内容就会一键转为思维导图模式。

或者直接复制Deepseek生成的结构化内容在Xmind AI 中选择一键生成选项直接复制文字内容，不过这种方式有使用次数限制。

4.动态优化

进行二次编辑，修改到自己满意。

高效生成图文

提示词：我需要用即梦AI生成一幅电影海报或随便说出你的要求，主题是XX。给我AI绘画中的中文提示词，我可以在即梦上直接画图。

Deepseek：输出···

文字创作

找好定位

提示词：我现在是一名XX，想成为一名XX领域的博主,我的特点是XX，请给我提供几个博主的人设定位参考，需要有定位名称以及详细说明，并且有自己的风格特点，有差异化。

Deepseek：输出···

设定选题

提示词：我的人设博主定位是XX，能给我具体的小红书短视频选题吗？

优化标题

提示词：请帮我优化标题XX，我希望能更吸引用户，更能提高被用户搜索到的概率，得到更多的认可。

Deepseek：输出···

创作文案

提示词：用XX为标题写一篇小红书短视频文案，我要来拍摄。

Deepseek：输出···

可以先投喂deepseek一个你认为好的内容，让他帮我们分析一下从选题、风格、特点、情绪共鸣，为什么能成为爆款，以及用户为什么喜欢等角度进行拆解和分析。

然后让它运用以上分析，进行仿写。

25 5 月 2026

GEO关键词库搭建

从0到1构建一套让AI“看得懂、信得过、引用你”的关键词体系

先出核心结论 | 选对词，比写100篇文章更重要

写在前面：为什么需要一套专门的GEO关键词库？

开始之前先看一个根本问题：GEO关键词库和传统SEO关键词库，到底有什么区别？

维度	SEO关键词库	GEO关键词库
核心单位	词/短语	问题/场景
判断标准	搜索量	触发概率 + 引用概率
内容产出	围绕关键词写文章	围绕问题生产答案
成功标志	排名第1页	被AI引用为来源

一句话总结： SEO是“让用户搜到你”，GEO是“让AI选中你”。

以下6步，按执行顺序排列，建议逐项推进👇👇👇

Step 1：种子词扩展——从核心实体出发

1.1 确定核心实体

不是“核心关键词”，是“核心实体”。

区别在于⬇️：

关键词是字符串，比如“自动拉伸缠绕包装机”
实体是一个概念，带有属性和关系，比如“自动拉伸缠绕包装机”的属性包括：技术原理、核心参数、适用负载、包装效率、品牌对比、维护成本……

实操举例🌰： 假设你是一家出口型包装机械制造商，主营自动拉伸缠绕机、托盘裹包机等设备。你的核心实体可以包括：

自动拉伸缠绕包装机（核心产品）
托盘裹包机（产品线）
流水线末端包装系统（解决方案）
出口海运防损包装（应用场景）

1.2 实体扩展——挖掘关联实体

为核心实体找到“邻居实体”，扩展维度包括：

上位实体：属于什么大类（如包装机械、自动化设备）
下位实体：包含什么细分（如转盘式、摇臂式、在线式）
属性实体：有哪些技术特征（如最大载重、转盘直径、膜架类型）
动作实体：能完成什么任务（如货物裹包、防潮固定、防尘密封）
对比实体：常和谁比较（如收缩机、捆扎机、人工裹包）
场景实体：用在什么地方（如食品饮料、化工建材、出口海运）

结果产出： 一个包含15-30个实体的词网。

Step 2：多源采集——分享3个不同渠道挖出有价值的真问题

如果说种子词是骨架，那问题是血肉，敲黑板：GEO关键词库的核心单位是问题，不是词。

渠道一：AI模型反向挖掘（最高优先级）

让AI告诉你，用户在问什么👇：

操作： 在ChatGPT、Claude、Perplexity、Gemini中输入以下Prompt：

“List the top 20 questions that buyers ask when purchasing [你的产品]”
“What are the most common pain points when using [你的产品]?”
“What factors should buyers compare between [方案A] and [方案B]?”

注意： 不同AI模型输出的侧重点也不同，建议合并结果后去重。

渠道二：社区平台挖掘（验证真实性）

尽量真人口吻的问题，才是AI最可能遇到的查询形式。

操作平台👇：

Reddit（如 r/manufacturing、r/logistics）
Quora
行业专属论坛
YouTube评论区

采集方法🧐：

搜索核心实体词
筛选带有问号的帖子
原样记录用户的表述方式，不要翻译成专业术语

关键原则： 看用户怎么说，你就怎么记问题。

渠道三：传统SEO工具的疑问句过滤

利用我们常用的工具可以快速批量生成候选问题👇👇

操作： 在Ahrefs或SEMrush中输入种子词，然后：

导出所有包含疑问词的关键词：what、how、why、which
过滤掉长度少于5个单词的词条
过滤掉带有buy、cheap、discount等商业意图的词
按搜索量降序排列，作为参考数据

注意： 这个渠道只作为补充，不要作为主力

产出： 一个包含200-500个问题的问题池。

Step 3：意图分做层——按用户决策阶段打标签

同一个问题，用户却会处于不同的决策阶段，所以内容策略完全不同👀

四层意图分类体系

层级	名称	典型问法	内容策略	占比
L1	认知层	What is X？ How does X work？	科普体、原理类	20%
L2	探索层	What are the best X？ Which type is right for me？	选型指南	25%
L3	评估层	X vs Y？ Is X worth it？	深度对比、ROI分析	35%
L4	决策层	How to use X？ How to fix X？	教程体、操作指南	20%

为什么L3（评估层）占比这么高？

在B2B采购场景下，用户先用L1/L2了解基础概念，然后用L3做投资决策验证——这是最关键的一步，最后用L4完成操作。

AI在回答L3问题时，会优先引用带有成本数据、效率对比、ROI计算的内容。

打标签示例⬇️

问题	意图层级	问题类型	情绪倾向
What does pre-stretch mean on a wrapper？	L1	定义	困惑
Which wrapper has the lowest film break rate？	L2	推荐	急切
Is a used wrapper better than a new brand？	L3	验证	犹豫
How to calibrate the wrap force？	L4	操作	急切

Step 4：按优先级排序——用三维度评分筛选高价值词

找出的问题池可能有几百个，但资源有限，需要量化排序👇

三维评分模型

维度	权重	评分标准（1-5分）
触发概率	40%	5分：疑问句+7词以上+技术类 3分：中长尾问题 1分：短词/购物词
引用竞争力	35%	5分：当前AI引用的是小站/论坛 3分：有2-3个竞品覆盖 1分：已被权威站点垄断
业务相关度	25%	5分：直接匹配核心产品 3分：解决选型常见问题 1分：仅行业泛话题

综合得分 = 触发概率×0.4 + 引用竞争力×0.35 + 业务相关度×0.25

Step 5：按内容映射——匹配出最佳答案形态

不同的问题，需要不同的内容形态👀

问题类型 → 内容形态映射表

问题类型	最佳内容形态	AI偏好说明
What is X？	定义 + 关键属性列表	结构化优于散文
How to choose X？	选型决策树 + 对比表格	表格数据最易被引用
X vs Y？	对比表格（价格/效率/寿命）	多维度对比
Best X for 场景？	按场景分类推荐	需解释“为什么适合”
Is X worth it？	ROI分析 + 回本周期	数据支撑结论
Why is X not working？	诊断流程 + 分场景解决	逻辑分支结构

内容结构化的三个层级

第一层：页面标题结构（和SEO的H标题结构类似）

以“转盘式 vs 摇臂式缠绕机”为例：

大标题：转盘式 vs 摇臂式缠绕机：如何选型？
二级标题：核心原理差异
三级标题：9个维度深度对比（占地空间、最大负载、维护成本、价格区间等）
二级标题：选型决策树
二级标题：品牌配置方案

第二层：做语义标记（需要找懂代码的人辅助这一步哦）

使用Schema标记帮助AI理解内容类型：

教程类 → HowTo标记
对比类 → ItemList标记
选型指南 → FAQPage标记

第三层：内链关系

针对同一个实体的不同问题页面，建立双向链接。例如🌰：

“什么是拉伸缠绕机” → 链接到 “缠绕机 vs 收缩机对比”
“缠绕机 vs 收缩机对比” → 链接到 “缠绕机选型6步指南”

这能帮助AI建立“实体认知网络”。

内容新鲜度策略

数据表明：60天内更新的内容，被引用概率高1.9倍。

内容类型	更新频率	更新动作
品牌对比类	每季度	检查价格变化、新产品
技术参数类	每半年	验证参数标准
故障排查类	每年	新增案例
行业报告	每年	更新数据

低成本更新法： 不一定重写全文。在文章顶部加一段更新说明，更新关键数据，修改发布时间——AI会识别为新鲜内容。

Step 6：动态迭代——让词库“活”起来

关键词库不是一次性项目，而是需要持续运营的资产，不要搭建出来后就不看了🤔

三个核心监控指标⬇️

指标	定义	监控频率	参考阈值
引用率	多少问题被AI引用时出现了你的域名	每月	<5%需检查质量
新增问题数	每月新增的有效问题数量	每周	<20个需拓宽渠道
词库使用率	已产出内容的问题占比	每月	<40%加快产出

词库刷新机制

每周（30分钟）：

在Reddit相关板块浏览本周热门帖，记录3-5个新问题
检查竞品网站的新增内容标题

每月（2小时）：

在3个AI模型中重新跑Step 1的Prompt，对比结果变化
导出使用频率最低的20个问题，评估是否放弃
检查P2问题中是否有竞争者新入局

每季度（半天）：

全量复查引用竞争力维度
更新实体词网
重新跑三维评分，调整优先级

词库文档标准字段

建议用Excel或Notion维护，包含以下字段：

基础信息：问题原文、问题类型、意图层级、来源渠道
评分数据：触发概率分、引用竞争力分、业务相关度分、综合得分、优先级档位
内容信息：推荐内容形态、负责编辑、预期发布时间
效果追踪：是否已发布、是否被AI引用、引用来源域名
迭代记录：最后复查日期、备注

核心原则： 凡是无法衡量“是否被引用”的词库，都是🟰无用摆设。

总结：6步流程一览

步骤	核心产出	耗时预估	关键工具
Step 1 种子词扩展	实体词网（15-30个）	1-2天	脑暴 + 产品盘点
Step 2 多源采集	问题池（200-500个）	3-5天	AI模型 + Reddit + SEO工具
Step 3 意图分层	带标签的问题清单	1-2天	人工标注
Step 4 优先级排序	三维评分 + P0/P1/P2	1天	评分表模板
Step 5 内容映射	内容形态分配 + 排期	2-3天	内容日历
Step 6 动态迭代	活词库 + 监控	持续	数据追踪表

写在最后

这6步流程的价值，不在于“做出一张Excel表”，而在于让小伙伴们建立“GEO思维”——即从“我们的产品怎么排上去”转变为“AI为什么会引用我们的技术内容”来回答客户的真实问题。

对于B2B长决策周期产品，GEO的效果尤其明显：当客户用自然语言问出“摇臂式和转盘式缠绕机哪个更耐用”时，AI引用你的深度对比文章，比任何广告都更有说服力。

完善这篇信息，我个人认为GEO的词库搭建比SEO词库搭建要做的工作量更多

17 5 月 2026

Web2GPT 是啥

Web2GPT 是一款面向网站管理员的智能 AI 应用，可以将 传统网站 一键包装为 智能 AI 应用。

Web2GPT 会结合大模型技术，根据你提供的网站地址，自动梳理网站中的内容和网站的交互逻辑，自动化理解网站所提供的业务模式，自动生成 AI 应用，快速与你的其他业务系统进行集成。

官方主页：https://web2gpt.ai/
使用文档：https://docs.web2gpt.ai/
在线 Demo：https://web2gpt.chaitin.cn/

仅需三步，为你的网站配置一个 AI 助手

输入网站地址，让 Web2GPT 开始学习
在 Web2GPT 控制台里创建 AI 应用
使用 AI 应用

效果如何

网页挂件样式截图

AI 助手使用截图

产品后台截图

14 5 月 2026

手把手教你用 Sub2API 搭一个自己的 AI Token 中转站

最近不少人在研究 AI 中转站。表面上看，大家都在说“搭个网关”“转成 OpenAI 兼容接口”“统一接上游模型”，但真开始找方案时，很快就会遇到 3 个名字：New API、Sub2API、CLI Proxy API。

先用 30秒看懂这三个项目

1）New API
这个项目更像“通用 AI 网关底座”。它的定位是统一聚合和分发不同模型，把各种上游能力转换成 OpenAI / Claude / Gemini 兼容格式。你如果以后想做更综合的模型聚合平台，New API 是值得研究的。

2）Sub2API
这个项目更直接。它的目标就是把 AI 产品订阅能力分发成 API 调用能力，而且已经把多账号、API Key 分发、计费、并发控制、限速、后台管理、支付等能力都做进去了。换句话说，它更接近“能拿来跑业务”的那类项目。

3）CLI Proxy API
这个项目更偏“把 CLI 包起来”。它能提供 OpenAI / Gemini / Claude / Codex 兼容接口，适合把本地或多账号 CLI 访问方式统一成 API 形式。如果你的重点是 CLI 能力接入，这个方向会更对味。

如果你现在的目标是：先快速搭一个有后台、有账号管理、后面还能继续运营的中转站，那我觉得最值得先上手的，就是 Sub2API。

为什么我建议先从 Sub2API 开始

Github：https://github.com/Wei-Shaw/sub2api

很多人第一次搭中转站，会误以为“把请求转发出去”就够了。其实真正麻烦的，往往不是转发本身，而是后面的这些事：

怎么给不同用户发自己的 API Key
怎么统计用量、做计费
怎么限制并发和速率
怎么在后台看日志、看状态
怎么做充值或后续的商业化

而 Sub2API 最大的好处，就是它不是只给你一个“转发器”，而是已经把这些基础能力一并考虑进来了。对想认真做一个小平台的人来说，这比从零拼一堆组件省事得多。

开始部署前，你需要准备什么

这一篇我只讲 Docker Compose 这条线，因为它是上手最快、最适合先跑起来的方式。按照官方说明，Docker Compose 部署方式会把 PostgreSQL 和 Redis 一起带上，所以准备工作相对简单。

一台 Linux 服务器
Docker 20.10+
Docker Compose v2+
一个能登录服务器的 SSH 环境

建议

如果你是第一次搭，先别急着配域名和 HTTPS。先用 IP + 8080 把后台跑起来，确认服务正常，再做反向代理和正式对外开放。

第一步：一键拉起 Sub2API

如果你想最快把它跑起来，直接按官方给的快速开始命令来。它会自动准备部署目录、下载 Compose 文件和环境样例，并生成必要的安全凭证。

mkdir -p sub2api-deploy && cd sub2api-deploy

curl -sSL https://raw.githubusercontent.com/Wei-Shaw/sub2api/main/deploy/docker-deploy.sh | bash

docker compose up -d

跑完以后，再看一眼日志，确认服务已经启动：

docker compose logs -f sub2api

这一套做完，本质上就已经把主服务、数据库和 Redis 一起拉起来了。对于“先跑起来再说”的第一版，这是最省心的路径。

第二步：如果你想手动配环境，可以这样做

有些人不喜欢“一键脚本”，那就手动来。官方文档给的思路是：克隆仓库、进入 deploy 目录、复制 `.env.example` 为 `.env`，然后自己填写关键配置。

git clone https://github.com/Wei-Shaw/sub2api.git

cd sub2api/deploy

cp .env.example .env

nano .env

`.env` 里你至少要关注这几个东西：

POSTGRES_PASSWORD：数据库密码
JWT_SECRET：登录和会话相关密钥
TOTP_ENCRYPTION_KEY：双因素认证相关密钥
ADMIN_EMAIL / ADMIN_PASSWORD：管理员账号（可选，但建议配）
SERVER_PORT：服务端口，默认可以先用 8080

如果你不知道这些密钥怎么生成，最简单的办法就是直接用 OpenSSL：

openssl rand -hex 32

然后创建本地数据目录，再启动服务：

mkdir -p data postgres_data redis_data

docker compose -f docker-compose.local.yml up -d

docker compose -f docker-compose.local.yml ps

docker compose -f docker-compose.local.yml logs -f sub2api

第三步：进入后台

服务起来之后，直接在浏览器里打开：

http://你的服务器IP:8080

如果管理员密码是自动生成的，可以从日志里找：

docker compose -f docker-compose.local.yml logs sub2api | grep “admin password”

到这里，其实你已经完成了最关键的一步：平台已经能访问，后台已经能登录。后面要做的，无非就是继续往里面填配置、接上游账号、配 API Key、设置用户策略。

第四步：添加 Codex / OpenAI 账号授权

Sub2API 跑起来之后，下一步就是把上游账号接进去。以 Codex / OpenAI 账号授权为例，流程大致是：在系统里生成授权链接，复制到浏览器打开，登录 OpenAI 账号完成授权，然后把回调链接复制回 Sub2API。

这个步骤不是在服务器命令行里完成，而是在 Sub2API 的管理后台里操作。

具体流程如下。

1）进入添加账号页面

你会看到几个选项：

手动授权
手动输入 RT
手动输入 Mobile RT

对普通用户来说，优先用“手动授权”就行。这个方式最直观，不需要你自己去找 refresh token。

2）生成授权链接

点击页面里的“生成授权链接”。系统会生成一个 OpenAI 授权地址。

这个链接不要在后台页面里反复点，直接复制出来，然后在浏览器的新标签页里打开。

3）在浏览器里登录 OpenAI 并完成授权

打开授权链接后，浏览器会跳到 OpenAI 的登录 / 授权流程。这里正常登录你的 OpenAI 账号，并完成授权。

授权完成后，页面地址通常会跳转到一个类似这样的回调地址：

http://localhost:xxx/auth/callback?code=…

注意，这里看到 localhost 开头并不代表失败。它通常只是 OAuth 回调地址。你需要做的是把这个完整链接复制下来。

重点

不要只复制前面的 localhost，也不要手动改链接。直接复制浏览器地址栏里的完整回调链接，或者复制 code 参数后面的值。

4）把回调链接复制回 Sub2API

回到 Sub2API 的添加账号页面，在“授权链接或 Code”输入框里，把刚才复制到的完整回调链接粘贴进去。

系统一般会自动识别完整链接里的 code 参数。也就是说，你可以复制完整链接，也可以只复制 code 参数值。

5）点击完成授权

粘贴完成后，点击“完成授权”。如果没有报错，这个 OpenAI / Codex 账号就会被添加到 Sub2API 后台。

后面你就可以继续配置模型、用户 API Key、调用额度、并发限制和计费规则。

这里容易卡住的地方

第一，浏览器打开授权链接后可能加载比较慢，要等页面完整跳转。

第二，授权完成后看到 localhost 不要慌，重点是复制地址栏里的完整 callback 链接。

第三，如果复制 code 参数，注意不要漏掉字符，也不要带多余空格。

这几个细节，建议你一开始就注意

1）优先用 `docker-compose.local.yml`
官方文档明确给了两个版本：一个用本地目录存数据，一个用 Docker 命名卷。前者更适合备份和迁移，后面你要换服务器会轻松很多。

2）把 `.env` 保存好
JWT_SECRET、TOTP_ENCRYPTION_KEY、数据库密码这些东西一旦丢了，后面你会很难受。建议部署后第一时间做好备份。

3）先跑通，再优化
第一次部署时，不要同时上域名、反代、HTTPS、支付、监控。先把最小闭环跑通：服务能启动、后台能登录、能接上游、能出 API Key。后面再一层一层加。

提醒

如果你后面真的打算对外提供服务，部署只是开始。真正花时间的，往往是上游管理、额度控制、风控、支付、售后和稳定性。

4 5 月 2026

zeroart/api_spms_open

基于PHP原生开发的多用途api集成管理系统，评估简版。热门免费的轻量型API管理系统

https://gitee.com/zeroart/api_spms_open

22 4 月 2026

把AI大模型装进U盘里，完全离线、零痕迹、不限次数（附详细安装教程）

你有没有想过：把多个完整的AI大模型装进U盘里，插到任何电脑上都跑，不联网也行，所有数据留在U盘里不留下任何痕迹？

今天介绍的这个，已经把这个想法实现了。我已配置好模型和依赖，点开直接用

一、Portable AI USB是什么？

Portable AI USB是一个完全开源的便携式AI大模型方案，基于Ollama + AnythingLLM实现。装进U盘后，可以在任何Windows、Mac、Linux电脑上运行。

核心特点：

✅ 完全离线运行——首次安装后无需网络
✅ 零痕迹——不在电脑留下任何数据
✅ 不限次数——无需订阅，无需付费
✅ 支持6种模型——包括无审查版模型
✅ 支持自定义模型——可加载任意GGUF格式模型
✅ 多平台——Windows/Mac/Linux通用

二、支持的AI模型

安装时可选择下载以下模型，也可以自行上传GGUF格式模型：

模型	大小	类型	推荐场景
NemoMix Unleashed 12B	7.0 GB	⭐标准	最佳质量，推荐首选
Dolphin 2.9 Llama 3 8B	4.9 GB	标准	经典通用型
Mistral 7B Instruct	4.1 GB	标准	推理、编程能力强
Qwen 2.5 7B	4.7 GB	标准	中文能力出色
Llama 3.2 3B	2.0 GB	轻量	老电脑首选，速度快
Phi-3.5 Mini	2.2 GB	轻量	内存占用低
自定义GGUF模型	自定义	自定义	上传任意HuggingFace模型

三、完整安装教程（图文版）

准备工作

U盘一个，容量至少16GB（推荐64GB，多模型需更大空间）
格式化U盘为exFAT格式（Windows/Mac/Linux通用）
首次安装需要联网（下载模型用）
Windows/Mac/Linux各版本安装步骤略有不同，见下方详细说明

第一步：下载全部文件(文末链接下载）

全部文件，复制到U盘根目录。

第二步：运行安装脚本

进入U盘目录，双击运行：

install.bat

会弹出PowerShell窗口，按提示操作。

第三步：选择AI模型

安装过程中会显示模型列表，选择你想下载的模型编号：

1. NemoMix Unleashed 12B（推荐）
2. Dolphin 2.9 Llama 3 8B
3. Mistral 7B Instruct
4. Qwen 2.5 7B
5. Llama 3.2 3B（轻量）
6. Phi-3.5 Mini（轻量）
C. 自定义模型
请输入编号：

建议首次安装选择1号NemoMix或4号Qwen（中文能力最强）。

第四步：配置AnythingLLM安装路径

AnythingLLM安装程序会弹出，关键一步：

点击“Browse”（浏览）
定位到U盘根目录下的anythingllm文件夹
确认路径在U盘上，不是电脑本地硬盘
点击安装，等待完成
关闭安装程序

第五步：启动使用

安装完成后，每次使用只需双击：start-windows.bat :: Windows启动（推荐）start-mac.command :: Mac启动start-linux.sh :: Linux启动

会自动打开AnythingLLM聊天界面，直接开始对话。

第六步：切换模型

在AnythingLLM界面：Settings → LLM → 选择模型即可切换。

四、Mac / Linux 安装步骤

Mac系统

1. 下载文件到U盘
2. 双击 start-mac.command
3. 首次运行会自动下载Mac版引擎（约2分钟）
4. AnythingLLM界面会自动打开
5. 开始使用！

Linux系统

1. 下载文件到U盘
2. 打开终端，进入U盘目录
3. 赋予执行权限：

chmod +x start-linux.sh preflight-check.sh install.sh install-core.sh

4. 运行：

bash preflight-check.sh

5. 安装完成后，进入ANYTHINGLLM文件夹，打开AppImage文件
6. 开始使用

五、进阶配置：自定义模型

加载自定义模型

如果列表里没有你想要的模型，可以上传任意GGUF格式模型：

从HuggingFace（国内可从hf-mirror.com）下载想要的GGUF模型文件
把.gguf文件放入U盘models/文件夹
重新运行install.bat，选择选项C
粘贴HuggingFace的直接下载链接
安装脚本自动处理剩余步骤

调整Token上下文窗口

默认配置4K tokens，想调整：

打开U盘目录：anythingllm_data/storage/
编辑.env文件
找到OLLAMA_MODEL_TOKEN_LIMIT=4096
改成想要的数值（如8192）
保存后重启：双击start-windows.bat

六、如果模型下载失败怎么办

网络问题导致下载中断时：

安装窗口会显示HuggingFace（我已改成国内镜像地址）的下载链接
复制链接，用其他工具下载.gguf文件
将文件放入U盘models/文件夹
重新运行install.bat，会自动跳过已存在的文件

七、隐私安全说明

✅ 所有聊天记录存在U盘，不会上传到任何服务器
✅ 不在电脑留下任何注册表项或本地文件
✅ 完全离线运行，无网络请求
✅ 无遥测、无追踪、无日志上传

八、与普通AI工具对比

对比项	普通AI工具	Portable AI USB
网络要求	必须联网	首次安装后完全离线
数据隐私	数据在云端	数据在U盘，完全私有
使用次数	有限制或需付费	无限次使用
便携性	需登录账号	U盘即插即用
网络痕迹	留有使用记录	零痕迹，拔U盘就消失
适用场景	日常对话	离线/隐私/出差/特殊环境

九、系统要求

U盘容量：至少16GB（单模型），推荐32GB以上
U盘格式：exFAT（支持跨平台）
内存要求：建议16GB以上（运行大模型）
Windows版本：Windows 10/11
首次安装：需要联网下载模型（约4-7GB）

十、总结

Portable AI USB解决了一个很实际的问题：AI工具的便携性、隐私性、无限使用。

特别适合：

经常出差、需要在不同电脑上工作的人
对数据隐私敏感、不想让AI记录对话的人
网络不稳定或无法联网的环境
不想付费、想无限使用AI的人

只需要一个U盘，下载安装，第一次联网下载模型，之后走到哪用到哪。

工具就在那里，重要的是用起来。

21 4 月 2026

New API 是新一代 AI 网关与资产管理系统，作为 AI 基座平台，提供统一基础设施接入全球 30+ 主流 AI 服务（OpenAI、Claude、Gemini、DeepSeek 等）。平台核心特性包括统一 OpenAI 兼容接口、智能路由负载均衡、精细计费与权限管控、实时数据看板。平台支持多格式转换、推理力度控制、缓存计费等高级功能。采用 AGPLv3 开源协议，支持 Docker 一键部署，适配个人开发者到企业级多租户场景。

New API的主要功能

统一接口管理：提供兼容 OpenAI 格式的单一 API 端点，无缝接入全球 30+ 主流 AI 服务提供商。
智能路由调度：支持多渠道负载均衡、故障自动切换和加权随机分发，确保服务高可用性。
精细计费系统：支持实现按次数或按量计费、预付费充值、多倍率配置及缓存计费支持。
安全权限管控：提供令牌分组管理、模型访问限制、API 调用审计及多平台授权登录。
格式转换能力：支持 OpenAI、Claude Messages、Google Gemini 等多种 API 格式之间的相互转换。
推理力度控制：支持通过模型名称后缀灵活设置高、中、低不同级别的推理思考强度。
实时数据看板：提供可视化控制台、用量统计分析和成本监控的数据洞察功能。

New API的关键信息和使用要求

项目定位：新一代 AI 网关与资产管理系统，AI 基座平台
开源协议：GNU AGPLv3（可免费使用，SaaS 部署需开源）
兼容基础：基于 One API 开发，完全兼容原数据库
支持语言：简中、繁中、英文、法文、日文
部署方式：Docker / Docker Compose / 宝塔面板
数据库：SQLite（默认）/ MySQL ≥ 5.7.8 / PostgreSQL ≥ 9.6
Docker 镜像：calciumion/new-api:latest

New API的核心优势

统一接入：通过一个兼容 OpenAI 格式的 API 端点，可无缝接入全球 30+ 主流 AI 服务提供商，彻底告别多平台对接的繁琐工作。
智能路由：平台内置多渠道负载均衡、故障自动切换和加权随机分发机制，确保 AI 服务的高可用性和请求稳定性。
成本优化：支持缓存计费、按量或按次计费以及多倍率灵活配置，帮助用户实现精细化的成本控制和费用管理。
格式互通：提供 OpenAI、Claude Messages、Google Gemini 等多种 API 格式之间的自由转换能力，显著降低不同模型的接入门槛。
开箱即用：支持 Docker 一键部署，完全兼容 One API 数据库，提供宝塔面板可视化安装，极大简化部署流程。

如何使用New API

部署安装：克隆项目仓库到本地后编辑配置文件，执行 Docker 命令启动服务，通过浏览器访问默认 3000 端口进入系统。
初始配置：登录管理后台设置管理员账号，在渠道管理中添加各 AI 服务商的 API 密钥并配置权重与故障切换策略。
创建访问凭证：在令牌管理页面创建 API Key，设置额度限制、有效期和可用模型范围，为不同场景分配独立凭证实现权限隔离。
接入使用：将应用 API 基础地址指向 New API 部署地址，使用生成的令牌替换原密钥，保持 OpenAI 标准格式可无缝调用多平台模型。

New API的项目地址

项目官网：https://www.newapi.ai/
GitHub仓库：https://github.com/QuantumNous/new-api

New API的同类竞品对比

对比维度	New API	One API	LiteLLM
项目定位	AI 网关与资产管理系统，AI 基座平台	开源 AI 接口聚合与管理平台	多 LLM 路由与负载均衡工具
开发团队	锟腾科技（QuantumNous）	社区开源项目	BerriAI 团队
开源协议	GNU AGPLv3	MIT	MIT
核心功能	统一接口、智能路由、精细计费、格式转换、权限管控	渠道管理、令牌分发、额度控制	模型路由、故障切换、观测监控
支持模型	30+ 主流服务商（OpenAI、Claude、Gemini、DeepSeek、Midjourney、Suno 等）	20+ 主流服务商	100+ 模型提供商
格式转换	OpenAI ↔ Claude、OpenAI → Gemini、Thinking 内容转换	主要兼容 OpenAI 格式	统一为 OpenAI 格式输出

New API的应用场景

AI 模型对比测试：用户通过统一接口快速切换不同厂商模型，对比 GPT、Claude、Gemini、DeepSeek 等在实际任务中的表现，辅助技术选型决策。

个人开发者建站：快速搭建私人 AI 接口中转站，统一管理多个平台的 API 密钥，通过精细计费控制个人使用成本，避免频繁切换不同服务商的繁琐操作。

创业团队产品开发：为 AI 应用提供稳定的多模型后端支持，确保产品服务高可用，同时通过数据看板监控用量和成本，优化资源配置。

企业内部 AI 中台：平台支持构建企业级 AI 资产管理系统，统一管控模型访问和费用支出，满足合规要求并提升管理效率。

20 4 月 2026

做了一个 API 中转站，我才发现这行水有多深

最近刷短视频和文章，发现 API 中转站（也就是卖 token 的）火了。那么 token 是什么，是 AI 时代的燃料。

随之而来的也是各种”圈内黑话”：有人说中转站全是”水货”，拿着别的模型来滥竽充数；有人说”蒸馏卖数据”，收割一波直接跑路。说实话，这行现在乱得确实有点乱，外行看热闹，内行看门道，中间人看钱包。

其实，这玩意儿真没那么玄乎。花了半天时间，我自己也撸了一个中转平台。

核心就这几步：

1. 服务器： 选个稍微稳点的海外节点。
2. 域名： 别搞得太花哨，简单好记就行。
3. 订阅账号： 这是核心，必须是低价且稳的上游，不然扛不住。
4. 部署： 按照文档一步步走，也就半天的时间。

作为 AI 重度使用者，我手头那堆 AI 辅助工具，一会儿要 GPT 跑逻辑，一会儿要 Claude Opus 优化架构。来回切账号、挂代理、忍受那该死的 Stripe 支付报错、还得时刻担心账号被封，不挂 ISP 家庭宽带根本不行……确实是让人难受。

最关键的是额度不够用，一个账号额度 5h7d 根本不够用，多个账号还得来回切换。

自己搭个中转，主打就是一个：稳定，省心，不折腾。

01. 原理很简单，但门槛在”水面下”

API 中转站的逻辑说白了，就是”订阅转 API”。

通过购买官方的 Plus 账号或 Pro 账号，利用反代技术把网页端的会话形式（Chat）封装成标准的 API 接口。市面上主流的开源方案像 NewAPI 或者 s2a，源码谁都能用，技术门槛几乎为零。

但为什么不同家的 API 体验天差地别？

真正的门槛其实在”水面下”。首先是优质且稳定的上游号商。如果你直接去官网原价买订阅再拆开卖 token，那纯粹是在做慈善，还得贴上电费。如何在茫茫多的渠道里找到那些低价、且不容易被官方风控”连窝端”的神仙账号，才是最考验人脉和眼光的。

其次，除了正经订阅，圈子里还有很多走 Kiro，cursor，windsurf 等逆向方案过来的。还有黑产或者暴力破解的接口，虽然价格低到离谱，但用起来真的”不太行”。连接不稳定、回复被截断、甚至问着问着就断流，这种接口拿来玩玩可以，真拿来干活，分分钟想砸电脑。

02. 那些让人又爱又恨的模型

各家模型我也都测过：

• Claude Code：目前的”天花板”，也是最傲娇的。
Anthropic 对国内用户的敌意真的是写在脸上的。最近 Claude Code 甚至要搞 KYC 认证，只认护照、驾照原件，复印件和照片统统拒收。圈里有个梗：说是不知道当年百度对 Anthropic 的 CEO 做了什么，让人家记恨至今。
梗归梗，但它成本高、风控严是事实。即便如此，大家还是趋之若鹜，这真不是崇洋媚外，只有真正干活的人才知道，顶级模型那种”指哪打哪”的逻辑感，国内模型暂时还听不懂这种”人话”。
• GLM，qwen：怎么说呢，一言难尽。
我之前买过它的 Coding Plan，几十块钱，确实便宜。但实际用下来，处理点简单的体力活还可以，稍微牵扯到复杂的业务逻辑，它就开始装傻。作为生产力工具，它还差点火候。
• OpenAI Codex：我的心头好，性价比之王。
这是我测下来性价比最高的模型。之所以说它香，是因为它是真的能干活，不玩虚的，而且量大管饱，给的额度非常足。对于日常写代码来说，它就是那个最听话、最勤快的”赛博打工人”。

03. 聊聊 OpenClaw 和 Hermes

最近 Hermes 作为和 openclaw 经常放在一起对标的 agent，短短时间 github 就斩获了 97.3K 的 star。

说白了，Hermes 这波能火，不是靠营销吹出来的，也不是靠社区一帮人尬捧出来的，它是真把很多人最烦的那层窗户纸给捅破了：大家要的根本不是什么“会聊天”的 AI，而是一个能真正进场干活的 Agent。

为什么大家认 Hermes？核心就几点。

第一，它不是那种只会在对话框里“给建议”的花架子，它是真的能下场执行。
很多 Agent 产品嘴上说自己是智能体，结果本质上还是个高级聊天机器人：你让它改代码，它给你讲思路；你让它排查问题，它给你一堆正确的废话；你让它落地，它开始装死。Hermes 比较讨喜的一点，就是它明显更强调“动手能力”——该查文件查文件，该跑命令跑命令，该调工具调工具，不跟你整那么多虚头巴脑的。

第二，它的工程味很重，不是那种演示视频里看着很牛，真用起来一地鸡毛的东西。
真正长期写代码的人都知道，Agent 这玩意儿最难面不是“回答得像不像”，而是“在真实环境里能不能少犯蠢”。Hermes 被认可，本质上就是因为它在工程工作流里更顺：会调用工具、能拆任务、知道校验结果，出了问题也不是立刻开始一本道胡说八道。这种东西，外行可能感受不到，真正在项目里干活的人，一上手就知道差别在哪。

第三，它的“可控性”比很多同类产品强。
现在不少 Agent 最大的问题，不是不聪明，而是太飘。你一句话扔过去，它给你脑补八百公里，最后交回来一个和需求没啥关系的玩意儿。
有一个梗说的是像雇佣了一帮印度团队，总结汇报天花乱坠，情绪价值拉满，钱花了，事呢，也不能说没做。
Hermes 相对更像个能沟通的执行助手：你让它干什么，它就尽量沿着你的轨道走，而不是擅自加戏。对开发者来说，这点特别重要。因为生产环境里最怕的不是 AI 笨，最怕的是 AI 自作聪明。

至于它和 OpenClaw 的区别，我觉得一句话就能概括：
OpenClaw 更像“能力展示型选手”，Hermes 更像“上手就能干活的工兵型选手”。

OpenClaw 给人的感觉，是那种很容易让人眼前一亮的 Agent：理念新、动作猛、社区热度高，很多场景下也确实能打，属于“你一看就知道这东西有想象力”的路线。它更像是在往“更强的自主性、更完整的 Agent 形态”上冲，适合拿来探索边界，看看 Agent 到底还能卷到什么程度。

而 Hermes 这边，更容易获得一线用户的认可，恰恰不是因为它最会秀肌肉，而是因为它更务实。
它不一定每个 Demo 都最炸裂，但它更像一个你真愿意长期放进工作流里的东西。说难听点，很多产品是“发朋友圈很好看”，Hermes 这种是“你真会天天打开用”。这两者差别很大。前者是看热闹，后者是干生产。

再直白一点：
OpenClaw 更像在证明“Agent 可以有多强”，
Hermes 更像在回答“Agent 到底怎么才算好用”。

这也是为什么它能在这么短时间内积累这么高的关注度。不是因为大家突然集体情怀上头了，而是因为越来越多的人开始从“玩模型”切换到“用模型干活”。一旦进入这个阶段，评价标准就完全变了。谁更会说，不重要；谁更能稳稳把活干完，才重要。

所以 Hermes 火，不是偶然。
它踩中的其实是当下 Agent 圈最真实的痛点：少一点表演，多一点执行；少一点玄学，多一点落地；少一点“我觉得我能”，多一点“我已经帮你做了”。

04. 结语

折腾下来，API 中转站给我最大的感受是：这行的信息差实在太大了。
收了钱就跑路的、用盗刷卡账号来薅羊毛最后连累用户被封的，一抓一大把。新手进来，十个有八个要交学费。

核心逻辑就两条：

1. 别贪便宜，擦亮眼睛。 天上不会掉馅饼，掉下来的多半是陷阱。
2. 别怕折腾。 AI 这波浪潮里，工具链是核心生产力。花半天时间把自己的 API 流水线理顺，比你每天花两小时切账号、挂代理、对着报错发呆要划算得多。

18 4 月 2026

普通人不会写文章？用AI+朱雀AI，10分钟出一篇安全公众号

最近好多朋友跟我说：也想做个公众号，记录点东西、分享点干货，可就是不会写，坐在电脑前半天憋不出一句话。

好不容易用AI生成一篇，又怕被检测出来，限流、不推荐，白忙活一场。

其实真没那么复杂。今天就把我一直在用的完整流程分享给你，不用文笔好，不用懂排版，AI+朱雀AI，10分钟就能出一篇安全、能正常发的公众号文章。
1️⃣让AI搭框架，不写正文

打开你常用的AI工具，直接输入指令：
帮我写一个公众号文章大纲，主题是______，不用写完整内容，只要分小标题，每段提示大概写什么。
AI只会给你结构：标题、开头、分点、结尾。
这一步绝对安全，因为我们只让它搭架子，不生成完整段落。

2️⃣自己填“人话”，1分钟搞定

对着大纲，用你平时说话的语气往里填内容。
不用华丽辞藻，不用对仗工整，怎么聊天就怎么写：
• 我自己试过
• 给大家提个醒
• 说实话我一开始也不会
• 分享一下我的心得
哪怕每段只有两三句话，都比AI通篇生成更真实、更受欢迎。

3️⃣复制去朱雀AI检测
把写好的内容，粘贴到朱雀AI检测里测一遍。
大部分情况，因为是你自己组织的语言，AI概率都会很低。
就算有一两句标红，也只需要稍微换个说法，完全不用大改。

4️⃣复制到公众号，直接发布

检测通过后，直接粘贴到公众号后台，简单分个段，加个小标题，一篇文章就完成了。

整个流程下来，熟练之后真的10分钟足够。
不用怕不会写，不用怕被检测，普通人也能轻松坚持更新。

做公众号，从来不是比谁文笔更好，而是比谁更愿意坚持、更愿意真诚分享。
如果你也想开始，今天就可以试着动手写一篇啦。

11 4 月 2026

一个开源、功能强大的 AI 短剧工厂，从剧本到成片一条线搞定！

Jellyfish 是一个一站式 AI 生成短剧（竖屏短剧 / 微短剧）的生产工具，覆盖从剧本输入到智能分镜、角色/场景/道具一致性管理、AI 视频生成、后期剪辑，直至一键导出成片的完整流程。

应用场景

短剧/微短剧内容创作者：快速将创意转化为高质量短剧作品。
AI 影视工作室批量生产：高效批量生成短剧内容，满足市场需求。
个人创作者低成本试水：以较低成本尝试竖屏短剧创作。
教育/培训机构：制作教学短视频，丰富教学内容和形式。
品牌/电商：制作带剧情的产品宣传短片，提升产品吸引力。

功能模块

剧本输入：支持多种格式的剧本输入，为后续处理提供基础。
智能分镜：自动将剧本转化为可拍摄的分镜脚本。
角色/场景/道具一致性管理：确保在不同镜头中角色、场景、道具的一致性。
AI 视频生成：对接多种大模型 API，生成高质量视频片段。
后期剪辑：提供视频剪辑功能，对生成的视频进行后期处理。
一键导出成片：将剪辑好的视频一键导出为成品短剧。

功能特点

极致一致性：通过全局种子、统一风格、资产复用，解决 AI 生成中的人物/场景漂移问题。
工业化生产流程：从文学剧本到可拍摄分镜，再到视频片段，实现一条龙闭环生产。
可视化 & 可控：提供所见即所得的分镜编辑器、精细的镜头语言控制、实时预览功能。
资产复用体系：全生命周期管理角色/场景/道具/服装/提示词模板，提高生产效率。

项目技术栈

前端

框架：React 18 + TypeScript + Vite
UI 组件库：Ant Design / Tailwind CSS
状态管理：Redux Toolkit / Zustand
工作流编辑：React Flow
视频播放器：Video.js / Plyr
富文本/代码编辑：Monaco Editor / React Quill

后端（可选开源部分）

框架：Node.js / NestJS / FastAPI / Spring Boot
数据库：MySQL（通过 Docker Compose 启动）
文件存储：RustFS（提供 S3 API 接口）

AI 生成层

对接多种大模型 API，包括但不限于 OpenAI、Anthropic、Midjourney、Runway、Kling、Luma 等。

王道博客

王道博客

分类目录归档：AI智能体

GEO关键词库搭建

写在前面：为什么需要一套专门的GEO关键词库？

Step 1：种子词扩展——从核心实体出发

1.1 确定核心实体

1.2 实体扩展——挖掘关联实体

Step 2：多源采集——分享3个不同渠道挖出有价值的真问题

渠道一：AI模型反向挖掘（最高优先级）

渠道二：社区平台挖掘（验证真实性）

渠道三：传统SEO工具的疑问句过滤

Step 3：意图分做层——按用户决策阶段打标签

四层意图分类体系

为什么L3（评估层）占比这么高？

打标签示例⬇️

Step 4：按优先级排序——用三维度评分筛选高价值词

三维评分模型

Step 5：按内容映射——匹配出最佳答案形态

问题类型 → 内容形态映射表

内容结构化的三个层级

内容新鲜度策略

Step 6：动态迭代——让词库“活”起来

三个核心监控指标⬇️

词库刷新机制

词库文档标准字段

总结：6步流程一览

写在最后

Web2GPT 是啥

仅需三步，为你的网站配置一个 AI 助手

效果如何

先用 30秒看懂这三个项目

为什么我建议先从 Sub2API 开始

开始部署前，你需要准备什么

第一步：一键拉起 Sub2API

第二步：如果你想手动配环境，可以这样做

第三步：进入后台

第四步：添加 Codex / OpenAI 账号授权

1）进入添加账号页面

2）生成授权链接

3）在浏览器里登录 OpenAI 并完成授权

4）把回调链接复制回 Sub2API

5）点击完成授权

这几个细节，建议你一开始就注意

zeroart/api_spms_open

一、Portable AI USB是什么？

二、支持的AI模型

三、完整安装教程（图文版）

准备工作

第一步：下载全部文件(文末链接下载）

第三步：选择AI模型

第四步：配置AnythingLLM安装路径

第五步：启动使用

第六步：切换模型

Mac系统

Linux系统

五、进阶配置：自定义模型

加载自定义模型

调整Token上下文窗口

六、如果模型下载失败怎么办

七、隐私安全说明

八、与普通AI工具对比

九、系统要求

十、总结

New API的主要功能

New API的关键信息和使用要求

New API的核心优势

如何使用New API

New API的项目地址

New API的同类竞品对比

New API的应用场景

01. 原理很简单，但门槛在”水面下”

02. 那些让人又爱又恨的模型

03. 聊聊 OpenClaw 和 Hermes

04. 结语

应用场景

功能模块

功能特点

项目技术栈

前端