Deepseek使用指南-常用提示词模版

效率是市场竞争的基石,当AI这个高效的工具出现时,会更大的提高我们的生产效率,那让AI如何为我们日常工作赋能呢?今天给大家分享一下用Deepseek 的一些小方法,希望可以帮助到大家。生成思维导图

图片

1.信息整合(XX就是我们实际使用时需要查找的信息,这里我就用XX代替啦)

提示词:整合一下XX关于XX的相关信息,同时提取XX中的关键词

Deepseek:输出···

2.结构化设计

提示词:对上面的信息进行结构化呈现

Deepseek:输出···

3.可视化表达

提示词:把上面的内容用Markdown格式生成

Deepseek:输出···

把上面的结果复制到TXT文件中并保存,把文件后缀.txt修改为.md

打开Xmind,导入刚才的Markdown文件,导入后,上面结构化内容就会一键转为思维导图模式。

 

或者直接复制Deepseek生成的结构化内容在Xmind AI 中选择一键生成选项直接复制文字内容,不过这种方式有使用次数限制。

4.动态优化

进行二次编辑,修改到自己满意。

高效生成图文

图片

 提示词:我需要用即梦AI生成一幅电影海报或随便说出你的要求,主题是XX。给我AI绘画中的中文提示词,我可以在即梦上直接画图。

Deepseek:输出···

文字创作

找好定位

提示词:我现在是一名XX,想成为一名XX领域的博主,我的特点是XX,请给我提供几个博主的人设定位参考,需要有定位名称以及详细说明,并且有自己的风格特点,有差异化。

Deepseek:输出···

设定选题

提示词:我的人设博主定位是XX,能给我具体的小红书短视频选题吗?

优化标题

提示词:请帮我优化标题XX,我希望能更吸引用户,更能提高被用户搜索到的概率,得到更多的认可。

Deepseek:输出···

创作文案

提示词:用XX为标题写一篇小红书短视频文案,我要来拍摄。

Deepseek:输出···

可以先投喂deepseek一个你认为好的内容,让他帮我们分析一下从选题 、风格、特点、情绪共鸣,为什么能成为爆款,以及用户为什么喜欢等角度进行拆解和分析。

然后让它运用以上分析,进行仿写。

GEO关键词库搭建:6步实操流程

GEO关键词库搭建

从0到1构建一套让AI“看得懂、信得过、引用你”的关键词体系

先出核心结论 | 选对词,比写100篇文章更重要


写在前面:为什么需要一套专门的GEO关键词库?

开始之前先看一个根本问题:GEO关键词库和传统SEO关键词库,到底有什么区别?

维度SEO关键词库GEO关键词库
核心单位词/短语问题/场景
判断标准搜索量触发概率 + 引用概率
内容产出围绕关键词写文章围绕问题生产答案
成功标志排名第1页被AI引用为来源

一句话总结: SEO是“让用户搜到你”,GEO是“让AI选中你”。

以下6步,按执行顺序排列,建议逐项推进👇👇👇


Step 1:种子词扩展——从核心实体出发

1.1 确定核心实体

不是“核心关键词”,是“核心实体”。

区别在于⬇️:

  • 关键词是字符串,比如“自动拉伸缠绕包装机”
  • 实体是一个概念,带有属性和关系,比如“自动拉伸缠绕包装机”的属性包括:技术原理、核心参数、适用负载、包装效率、品牌对比、维护成本……

实操举例🌰: 假设你是一家出口型包装机械制造商,主营自动拉伸缠绕机、托盘裹包机等设备。你的核心实体可以包括:

  • 自动拉伸缠绕包装机(核心产品)
  • 托盘裹包机(产品线)
  • 流水线末端包装系统(解决方案)
  • 出口海运防损包装(应用场景)

1.2 实体扩展——挖掘关联实体

为核心实体找到“邻居实体”,扩展维度包括:

  • 上位实体:属于什么大类(如包装机械、自动化设备)
  • 下位实体:包含什么细分(如转盘式、摇臂式、在线式)
  • 属性实体:有哪些技术特征(如最大载重、转盘直径、膜架类型)
  • 动作实体:能完成什么任务(如货物裹包、防潮固定、防尘密封)
  • 对比实体:常和谁比较(如收缩机、捆扎机、人工裹包)
  • 场景实体:用在什么地方(如食品饮料、化工建材、出口海运)

结果产出: 一个包含15-30个实体的词网。


Step 2:多源采集——分享3个不同渠道挖出有价值的真问题

如果说种子词是骨架,那问题是血肉,敲黑板:GEO关键词库的核心单位是问题,不是词。

渠道一:AI模型反向挖掘(最高优先级)

让AI告诉你,用户在问什么👇:

操作: 在ChatGPT、Claude、Perplexity、Gemini中输入以下Prompt:

  • “List the top 20 questions that buyers ask when purchasing [你的产品]”
  • “What are the most common pain points when using [你的产品]?”
  • “What factors should buyers compare between [方案A] and [方案B]?”

注意: 不同AI模型输出的侧重点也不同,建议合并结果后去重。

渠道二:社区平台挖掘(验证真实性)

尽量真人口吻的问题,才是AI最可能遇到的查询形式。

操作平台👇:

  • Reddit(如 r/manufacturing、r/logistics)
  • Quora
  • 行业专属论坛
  • YouTube评论区

采集方法🧐:

  1. 搜索核心实体词
  2. 筛选带有问号的帖子
  3. 原样记录用户的表述方式,不要翻译成专业术语

关键原则: 看用户怎么说,你就怎么记问题。

渠道三:传统SEO工具的疑问句过滤

利用我们常用的工具可以快速批量生成候选问题👇👇

操作: 在Ahrefs或SEMrush中输入种子词,然后:

  1. 导出所有包含疑问词的关键词:what、how、why、which
  2. 过滤掉长度少于5个单词的词条
  3. 过滤掉带有buy、cheap、discount等商业意图的词
  4. 按搜索量降序排列,作为参考数据

注意: 这个渠道只作为补充,不要作为主力

产出: 一个包含200-500个问题的问题池。


Step 3:意图分做层——按用户决策阶段打标签

同一个问题,用户却会处于不同的决策阶段,所以内容策略完全不同👀

四层意图分类体系

层级名称典型问法内容策略占比
L1认知层What is X? How does X work?科普体、原理类20%
L2探索层What are the best X? Which type is right for me?选型指南25%
L3评估层X vs Y? Is X worth it?深度对比、ROI分析35%
L4决策层How to use X? How to fix X?教程体、操作指南20%

为什么L3(评估层)占比这么高?

在B2B采购场景下,用户先用L1/L2了解基础概念,然后用L3做投资决策验证——这是最关键的一步,最后用L4完成操作。

AI在回答L3问题时,会优先引用带有成本数据、效率对比、ROI计算的内容。

打标签示例⬇️

问题意图层级问题类型情绪倾向
What does pre-stretch mean on a wrapper?L1定义困惑
Which wrapper has the lowest film break rate?L2推荐急切
Is a used wrapper better than a new brand?L3验证犹豫
How to calibrate the wrap force?L4操作急切

Step 4:按优先级排序——用三维度评分筛选高价值词

找出的问题池可能有几百个,但资源有限,需要量化排序👇

三维评分模型

维度权重评分标准(1-5分)
触发概率40%5分:疑问句+7词以上+技术类
3分:中长尾问题
1分:短词/购物词
引用竞争力35%5分:当前AI引用的是小站/论坛
3分:有2-3个竞品覆盖
1分:已被权威站点垄断
业务相关度25%5分:直接匹配核心产品
3分:解决选型常见问题
1分:仅行业泛话题

综合得分 = 触发概率×0.4 + 引用竞争力×0.35 + 业务相关度×0.25


Step 5:按内容映射——匹配出最佳答案形态

不同的问题,需要不同的内容形态👀

问题类型 → 内容形态映射表

问题类型最佳内容形态AI偏好说明
What is X?定义 + 关键属性列表结构化优于散文
How to choose X?选型决策树 + 对比表格表格数据最易被引用
X vs Y?对比表格(价格/效率/寿命)多维度对比
Best X for 场景?按场景分类推荐需解释“为什么适合”
Is X worth it?ROI分析 + 回本周期数据支撑结论
Why is X not working?诊断流程 + 分场景解决逻辑分支结构

内容结构化的三个层级

第一层:页面标题结构(和SEO的H标题结构类似)

以“转盘式 vs 摇臂式缠绕机”为例:

  • 大标题:转盘式 vs 摇臂式缠绕机:如何选型?
  • 二级标题:核心原理差异
  • 三级标题:9个维度深度对比(占地空间、最大负载、维护成本、价格区间等)
  • 二级标题:选型决策树
  • 二级标题:品牌配置方案

第二层:做语义标记(需要找懂代码的人辅助这一步哦)

使用Schema标记帮助AI理解内容类型:

  • 教程类 → HowTo标记
  • 对比类 → ItemList标记
  • 选型指南 → FAQPage标记

第三层:内链关系

针对同一个实体的不同问题页面,建立双向链接。例如🌰:

  • “什么是拉伸缠绕机” → 链接到 “缠绕机 vs 收缩机对比”
  • “缠绕机 vs 收缩机对比” → 链接到 “缠绕机选型6步指南”

这能帮助AI建立“实体认知网络”。

内容新鲜度策略

数据表明:60天内更新的内容,被引用概率高1.9倍。

内容类型更新频率更新动作
品牌对比类每季度检查价格变化、新产品
技术参数类每半年验证参数标准
故障排查类每年新增案例
行业报告每年更新数据

低成本更新法: 不一定重写全文。在文章顶部加一段更新说明,更新关键数据,修改发布时间——AI会识别为新鲜内容。


Step 6:动态迭代——让词库“活”起来

关键词库不是一次性项目,而是需要持续运营的资产,不要搭建出来后就不看了🤔

三个核心监控指标⬇️

指标定义监控频率参考阈值
引用率多少问题被AI引用时出现了你的域名每月<5%需检查质量
新增问题数每月新增的有效问题数量每周<20个需拓宽渠道
词库使用率已产出内容的问题占比每月<40%加快产出

词库刷新机制

每周(30分钟):

  • 在Reddit相关板块浏览本周热门帖,记录3-5个新问题
  • 检查竞品网站的新增内容标题

每月(2小时):

  • 在3个AI模型中重新跑Step 1的Prompt,对比结果变化
  • 导出使用频率最低的20个问题,评估是否放弃
  • 检查P2问题中是否有竞争者新入局

每季度(半天):

  • 全量复查引用竞争力维度
  • 更新实体词网
  • 重新跑三维评分,调整优先级

词库文档标准字段

建议用Excel或Notion维护,包含以下字段:

  • 基础信息:问题原文、问题类型、意图层级、来源渠道
  • 评分数据:触发概率分、引用竞争力分、业务相关度分、综合得分、优先级档位
  • 内容信息:推荐内容形态、负责编辑、预期发布时间
  • 效果追踪:是否已发布、是否被AI引用、引用来源域名
  • 迭代记录:最后复查日期、备注

核心原则: 凡是无法衡量“是否被引用”的词库,都是🟰无用摆设。


总结:6步流程一览

步骤核心产出耗时预估关键工具
Step 1 种子词扩展实体词网(15-30个)1-2天脑暴 + 产品盘点
Step 2 多源采集问题池(200-500个)3-5天AI模型 + Reddit + SEO工具
Step 3 意图分层带标签的问题清单1-2天人工标注
Step 4 优先级排序三维评分 + P0/P1/P21天评分表模板
Step 5 内容映射内容形态分配 + 排期2-3天内容日历
Step 6 动态迭代活词库 + 监控持续数据追踪表

写在最后

这6步流程的价值,不在于“做出一张Excel表”,而在于让小伙伴们建立“GEO思维”——即从“我们的产品怎么排上去”转变为“AI为什么会引用我们的技术内容”来回答客户的真实问题。

对于B2B长决策周期产品,GEO的效果尤其明显:当客户用自然语言问出“摇臂式和转盘式缠绕机哪个更耐用”时,AI引用你的深度对比文章,比任何广告都更有说服力。

完善这篇信息,我个人认为GEO的词库搭建比SEO词库搭建要做的工作量更多

AI 助手 Web2GPT 【免费版】终于发布了

Web2GPT 是啥

Web2GPT 是一款面向网站管理员的智能 AI 应用,可以将 传统网站 一键包装为 智能 AI 应用

Web2GPT 会结合大模型技术,根据你提供的网站地址,自动梳理网站中的内容和网站的交互逻辑,自动化理解网站所提供的业务模式,自动生成 AI 应用,快速与你的其他业务系统进行集成。

官方主页:https://web2gpt.ai/
使用文档:https://docs.web2gpt.ai/
在线 Demo:https://web2gpt.chaitin.cn/

仅需三步,为你的网站配置一个 AI 助手

  1. 输入网站地址,让 Web2GPT 开始学习
  2. 在 Web2GPT 控制台里创建 AI 应用
  3. 使用 AI 应用

效果如何

网页挂件样式截图
image.png

AI 助手使用截图
image.png

产品后台截图
image.png

手把手教你用 Sub2API 搭一个自己的 AI Token 中转站

最近不少人在研究 AI 中转站。表面上看,大家都在说“搭个网关”“转成 OpenAI 兼容接口”“统一接上游模型”,但真开始找方案时,很快就会遇到 3 个名字:New API、Sub2API、CLI Proxy API。

先用 30秒看懂这三个项目

1)New API
这个项目更像“通用 AI 网关底座”。它的定位是统一聚合和分发不同模型,把各种上游能力转换成 OpenAI / Claude / Gemini 兼容格式。你如果以后想做更综合的模型聚合平台,New API 是值得研究的。

2)Sub2API
这个项目更直接。它的目标就是把 AI 产品订阅能力分发成 API 调用能力,而且已经把多账号、API Key 分发、计费、并发控制、限速、后台管理、支付等能力都做进去了。换句话说,它更接近“能拿来跑业务”的那类项目。

3)CLI Proxy API
这个项目更偏“把 CLI 包起来”。它能提供 OpenAI / Gemini / Claude / Codex 兼容接口,适合把本地或多账号 CLI 访问方式统一成 API 形式。如果你的重点是 CLI 能力接入,这个方向会更对味。

如果你现在的目标是:先快速搭一个有后台、有账号管理、后面还能继续运营的中转站,那我觉得最值得先上手的,就是 Sub2API。


为什么我建议先从 Sub2API 开始

Github:https://github.com/Wei-Shaw/sub2api

很多人第一次搭中转站,会误以为“把请求转发出去”就够了。其实真正麻烦的,往往不是转发本身,而是后面的这些事:

  • 怎么给不同用户发自己的 API Key
  • 怎么统计用量、做计费
  • 怎么限制并发和速率
  • 怎么在后台看日志、看状态
  • 怎么做充值或后续的商业化

而 Sub2API 最大的好处,就是它不是只给你一个“转发器”,而是已经把这些基础能力一并考虑进来了。对想认真做一个小平台的人来说,这比从零拼一堆组件省事得多。

开始部署前,你需要准备什么

这一篇我只讲 Docker Compose 这条线,因为它是上手最快、最适合先跑起来的方式。按照官方说明,Docker Compose 部署方式会把 PostgreSQL 和 Redis 一起带上,所以准备工作相对简单。

  • 一台 Linux 服务器
  • Docker 20.10+
  • Docker Compose v2+
  • 一个能登录服务器的 SSH 环境

建议

如果你是第一次搭,先别急着配域名和 HTTPS。先用 IP + 8080 把后台跑起来,确认服务正常,再做反向代理和正式对外开放。

第一步:一键拉起 Sub2API

如果你想最快把它跑起来,直接按官方给的快速开始命令来。它会自动准备部署目录、下载 Compose 文件和环境样例,并生成必要的安全凭证。

mkdir -p sub2api-deploy && cd sub2api-deploy

curl -sSL https://raw.githubusercontent.com/Wei-Shaw/sub2api/main/deploy/docker-deploy.sh | bash

docker compose up -d

跑完以后,再看一眼日志,确认服务已经启动:

docker compose logs -f sub2api

这一套做完,本质上就已经把主服务、数据库和 Redis 一起拉起来了。对于“先跑起来再说”的第一版,这是最省心的路径。

第二步:如果你想手动配环境,可以这样做

有些人不喜欢“一键脚本”,那就手动来。官方文档给的思路是:克隆仓库、进入 deploy 目录、复制 `.env.example` 为 `.env`,然后自己填写关键配置。

git clone https://github.com/Wei-Shaw/sub2api.git

cd sub2api/deploy

cp .env.example .env

nano .env

`.env` 里你至少要关注这几个东西:

  • POSTGRES_PASSWORD:数据库密码
  • JWT_SECRET:登录和会话相关密钥
  • TOTP_ENCRYPTION_KEY:双因素认证相关密钥
  • ADMIN_EMAIL / ADMIN_PASSWORD:管理员账号(可选,但建议配)
  • SERVER_PORT:服务端口,默认可以先用 8080

如果你不知道这些密钥怎么生成,最简单的办法就是直接用 OpenSSL:

openssl rand -hex 32

openssl rand -hex 32

openssl rand -hex 32

然后创建本地数据目录,再启动服务:

mkdir -p data postgres_data redis_data

docker compose -f docker-compose.local.yml up -d

docker compose -f docker-compose.local.yml ps

docker compose -f docker-compose.local.yml logs -f sub2api

第三步:进入后台

服务起来之后,直接在浏览器里打开:

http://你的服务器IP:8080

如果管理员密码是自动生成的,可以从日志里找:

docker compose -f docker-compose.local.yml logs sub2api | grep “admin password”

到这里,其实你已经完成了最关键的一步:平台已经能访问,后台已经能登录。后面要做的,无非就是继续往里面填配置、接上游账号、配 API Key、设置用户策略。

第四步:添加 Codex / OpenAI 账号授权

Sub2API 跑起来之后,下一步就是把上游账号接进去。以 Codex / OpenAI 账号授权为例,流程大致是:在系统里生成授权链接,复制到浏览器打开,登录 OpenAI 账号完成授权,然后把回调链接复制回 Sub2API。

这个步骤不是在服务器命令行里完成,而是在 Sub2API 的管理后台里操作。

具体流程如下。

1)进入添加账号页面

登录 Sub2API 后台后,找到账号管理相关入口,点击“添加账号”。在授权方式里选择 OpenAI 账户授权。

你会看到几个选项:

  • 手动授权
  • 手动输入 RT
  • 手动输入 Mobile RT

对普通用户来说,优先用“手动授权”就行。这个方式最直观,不需要你自己去找 refresh token。

2)生成授权链接

点击页面里的“生成授权链接”。系统会生成一个 OpenAI 授权地址。

这个链接不要在后台页面里反复点,直接复制出来,然后在浏览器的新标签页里打开。

3)在浏览器里登录 OpenAI 并完成授权

打开授权链接后,浏览器会跳到 OpenAI 的登录 / 授权流程。这里正常登录你的 OpenAI 账号,并完成授权。

授权完成后,页面地址通常会跳转到一个类似这样的回调地址:

http://localhost:xxx/auth/callback?code=…

注意,这里看到 localhost 开头并不代表失败。它通常只是 OAuth 回调地址。你需要做的是把这个完整链接复制下来。

重点

不要只复制前面的 localhost,也不要手动改链接。直接复制浏览器地址栏里的完整回调链接,或者复制 code 参数后面的值。

4)把回调链接复制回 Sub2API

回到 Sub2API 的添加账号页面,在“授权链接或 Code”输入框里,把刚才复制到的完整回调链接粘贴进去。

系统一般会自动识别完整链接里的 code 参数。也就是说,你可以复制完整链接,也可以只复制 code 参数值。

5)点击完成授权

粘贴完成后,点击“完成授权”。如果没有报错,这个 OpenAI / Codex 账号就会被添加到 Sub2API 后台。

后面你就可以继续配置模型、用户 API Key、调用额度、并发限制和计费规则。

这里容易卡住的地方

第一,浏览器打开授权链接后可能加载比较慢,要等页面完整跳转。

第二,授权完成后看到 localhost 不要慌,重点是复制地址栏里的完整 callback 链接。

第三,如果复制 code 参数,注意不要漏掉字符,也不要带多余空格。


这几个细节,建议你一开始就注意

1)优先用 `docker-compose.local.yml`
官方文档明确给了两个版本:一个用本地目录存数据,一个用 Docker 命名卷。前者更适合备份和迁移,后面你要换服务器会轻松很多。

2)把 `.env` 保存好
JWT_SECRET、TOTP_ENCRYPTION_KEY、数据库密码这些东西一旦丢了,后面你会很难受。建议部署后第一时间做好备份。

3)先跑通,再优化
第一次部署时,不要同时上域名、反代、HTTPS、支付、监控。先把最小闭环跑通:服务能启动、后台能登录、能接上游、能出 API Key。后面再一层一层加。

提醒

如果你后面真的打算对外提供服务,部署只是开始。真正花时间的,往往是上游管理、额度控制、风控、支付、售后和稳定性。

把AI大模型装进U盘里,完全离线、零痕迹、不限次数(附详细安装教程)

你有没有想过:把多个完整的AI大模型装进U盘里,插到任何电脑上都跑,不联网也行,所有数据留在U盘里不留下任何痕迹?

今天介绍的这个,已经把这个想法实现了。我已配置好模型和依赖,点开直接用

一、Portable AI USB是什么?

Portable AI USB是一个完全开源的便携式AI大模型方案,基于Ollama + AnythingLLM实现。装进U盘后,可以在任何Windows、Mac、Linux电脑上运行。

核心特点:

  • ✅ 完全离线运行——首次安装后无需网络
  • ✅ 零痕迹——不在电脑留下任何数据
  • ✅ 不限次数——无需订阅,无需付费
  • ✅ 支持6种模型——包括无审查版模型
  • ✅ 支持自定义模型——可加载任意GGUF格式模型
  • ✅ 多平台——Windows/Mac/Linux通用

二、支持的AI模型

安装时可选择下载以下模型,也可以自行上传GGUF格式模型:

模型大小类型推荐场景
NemoMix Unleashed 12B7.0 GB⭐标准最佳质量,推荐首选
Dolphin 2.9 Llama 3 8B4.9 GB标准经典通用型
Mistral 7B Instruct4.1 GB标准推理、编程能力强
Qwen 2.5 7B4.7 GB标准中文能力出色
Llama 3.2 3B2.0 GB轻量老电脑首选,速度快
Phi-3.5 Mini2.2 GB轻量内存占用低
自定义GGUF模型自定义自定义上传任意HuggingFace模型

三、完整安装教程(图文版)

准备工作

  • U盘一个,容量至少16GB(推荐64GB,多模型需更大空间)
  • 格式化U盘为exFAT格式(Windows/Mac/Linux通用)
  • 首次安装需要联网(下载模型用)
  • Windows/Mac/Linux各版本安装步骤略有不同,见下方详细说明

第一步:下载全部文件(文末链接下载)

全部文件,复制到U盘根目录。

第二步:运行安装脚本

进入U盘目录,双击运行:

install.bat

会弹出PowerShell窗口,按提示操作。

第三步:选择AI模型

安装过程中会显示模型列表,选择你想下载的模型编号:

1. NemoMix Unleashed 12B(推荐)
2. Dolphin 2.9 Llama 3 8B
3. Mistral 7B Instruct
4. Qwen 2.5 7B
5. Llama 3.2 3B(轻量)
6. Phi-3.5 Mini(轻量)
C. 自定义模型
请输入编号:

建议首次安装选择1号NemoMix4号Qwen(中文能力最强)。

第四步:配置AnythingLLM安装路径

AnythingLLM安装程序会弹出,关键一步

  1. 点击“Browse”(浏览)
  2. 定位到U盘根目录下的anythingllm文件夹
  3. 确认路径在U盘上,不是电脑本地硬盘
  4. 点击安装,等待完成
  5. 关闭安装程序

第五步:启动使用

安装完成后,每次使用只需双击:start-windows.bat        :: Windows启动(推荐)start-mac.command     :: Mac启动
start-linux.sh     :: Linux启动

会自动打开AnythingLLM聊天界面,直接开始对话。

第六步:切换模型

在AnythingLLM界面:Settings → LLM → 选择模型即可切换。

图片

四、Mac / Linux 安装步骤

Mac系统

1. 下载文件到U盘
2. 双击 start-mac.command
3. 首次运行会自动下载Mac版引擎(约2分钟)
4. AnythingLLM界面会自动打开
5. 开始使用!

Linux系统

1. 下载文件到U盘
2. 打开终端,进入U盘目录
3. 赋予执行权限:
   
chmod +x start-linux.sh preflight-check.sh install.sh install-core.sh
4. 运行:
   
bash preflight-check.sh
5. 安装完成后,进入ANYTHINGLLM文件夹,打开AppImage文件
6. 开始使用

五、进阶配置:自定义模型

加载自定义模型

如果列表里没有你想要的模型,可以上传任意GGUF格式模型:

  1. 从HuggingFace(国内可从hf-mirror.com)下载想要的GGUF模型文件
  2. 把.gguf文件放入U盘models/文件夹
  3. 重新运行install.bat,选择选项C
  4. 粘贴HuggingFace的直接下载链接
  5. 安装脚本自动处理剩余步骤

调整Token上下文窗口

默认配置4K tokens,想调整:

  1. 打开U盘目录:anythingllm_data/storage/
  2. 编辑.env文件
  3. 找到OLLAMA_MODEL_TOKEN_LIMIT=4096
  4. 改成想要的数值(如8192)
  5. 保存后重启:双击start-windows.bat

六、如果模型下载失败怎么办

网络问题导致下载中断时:

  1. 安装窗口会显示HuggingFace(我已改成国内镜像地址)的下载链接
  2. 复制链接,用其他工具下载.gguf文件
  3. 将文件放入U盘models/文件夹
  4. 重新运行install.bat,会自动跳过已存在的文件

七、隐私安全说明

  • ✅ 所有聊天记录存在U盘,不会上传到任何服务器
  • ✅ 不在电脑留下任何注册表项或本地文件
  • ✅ 完全离线运行,无网络请求
  • ✅ 无遥测、无追踪、无日志上传

八、与普通AI工具对比

对比项普通AI工具Portable AI USB
网络要求必须联网首次安装后完全离线
数据隐私数据在云端数据在U盘,完全私有
使用次数有限制或需付费无限次使用
便携性需登录账号U盘即插即用
网络痕迹留有使用记录零痕迹,拔U盘就消失
适用场景日常对话离线/隐私/出差/特殊环境

九、系统要求

  • U盘容量:至少16GB(单模型),推荐32GB以上
  • U盘格式:exFAT(支持跨平台)
  • 内存要求:建议16GB以上(运行大模型)
  • Windows版本:Windows 10/11
  • 首次安装:需要联网下载模型(约4-7GB)

十、总结

Portable AI USB解决了一个很实际的问题:AI工具的便携性、隐私性、无限使用

特别适合:

  • 经常出差、需要在不同电脑上工作的人
  • 对数据隐私敏感、不想让AI记录对话的人
  • 网络不稳定或无法联网的环境
  • 不想付费、想无限使用AI的人

只需要一个U盘,下载安装,第一次联网下载模型,之后走到哪用到哪。

工具就在那里,重要的是用起来。

开源API网关new-api

New API是什么

New API 是新一代 AI 网关与资产管理系统,作为 AI 基座平台,提供统一基础设施接入全球 30+ 主流 AI 服务(OpenAI、Claude、Gemini、DeepSeek 等)。平台核心特性包括统一 OpenAI 兼容接口、智能路由负载均衡、精细计费与权限管控、实时数据看板。平台支持多格式转换、推理力度控制、缓存计费等高级功能。采用 AGPLv3 开源协议,支持 Docker 一键部署,适配个人开发者到企业级多租户场景。

New API

New API的主要功能

  • 统一接口管理:提供兼容 OpenAI 格式的单一 API 端点,无缝接入全球 30+ 主流 AI 服务提供商。
  • 智能路由调度:支持多渠道负载均衡、故障自动切换和加权随机分发,确保服务高可用性。
  • 精细计费系统:支持实现按次数或按量计费、预付费充值、多倍率配置及缓存计费支持。
  • 安全权限管控:提供令牌分组管理、模型访问限制、API 调用审计及多平台授权登录。
  • 格式转换能力:支持 OpenAI、Claude Messages、Google Gemini 等多种 API 格式之间的相互转换。
  • 推理力度控制:支持通过模型名称后缀灵活设置高、中、低不同级别的推理思考强度。
  • 实时数据看板:提供可视化控制台、用量统计分析和成本监控的数据洞察功能。

New API的关键信息和使用要求

  • 项目定位:新一代 AI 网关与资产管理系统,AI 基座平台
  • 开源协议:GNU AGPLv3(可免费使用,SaaS 部署需开源)
  • 兼容基础:基于 One API 开发,完全兼容原数据库
  • 支持语言:简中、繁中、英文、法文、日文
  • 部署方式:Docker / Docker Compose / 宝塔面板
  • 数据库:SQLite(默认)/ MySQL ≥ 5.7.8 / PostgreSQL ≥ 9.6
  • Docker 镜像:calciumion/new-api:latest

New API的核心优势

  • 统一接入:通过一个兼容 OpenAI 格式的 API 端点,可无缝接入全球 30+ 主流 AI 服务提供商,彻底告别多平台对接的繁琐工作。
  • 智能路由:平台内置多渠道负载均衡、故障自动切换和加权随机分发机制,确保 AI 服务的高可用性和请求稳定性。
  • 成本优化:支持缓存计费、按量或按次计费以及多倍率灵活配置,帮助用户实现精细化的成本控制和费用管理。
  • 格式互通:提供 OpenAI、Claude Messages、Google Gemini 等多种 API 格式之间的自由转换能力,显著降低不同模型的接入门槛。
  • 开箱即用:支持 Docker 一键部署,完全兼容 One API 数据库,提供宝塔面板可视化安装,极大简化部署流程。

如何使用New API

  • 部署安装:克隆项目仓库到本地后编辑配置文件,执行 Docker 命令启动服务,通过浏览器访问默认 3000 端口进入系统。
  • 初始配置:登录管理后台设置管理员账号,在渠道管理中添加各 AI 服务商的 API 密钥并配置权重与故障切换策略。
  • 创建访问凭证:在令牌管理页面创建 API Key,设置额度限制、有效期和可用模型范围,为不同场景分配独立凭证实现权限隔离。
  • 接入使用:将应用 API 基础地址指向 New API 部署地址,使用生成的令牌替换原密钥,保持 OpenAI 标准格式可无缝调用多平台模型。

New API的项目地址

  • 项目官网:https://www.newapi.ai/
  • GitHub仓库:https://github.com/QuantumNous/new-api

New API的同类竞品对比

对比维度New APIOne APILiteLLM
项目定位AI 网关与资产管理系统,AI 基座平台开源 AI 接口聚合与管理平台多 LLM 路由与负载均衡工具
开发团队锟腾科技(QuantumNous)社区开源项目BerriAI 团队
开源协议GNU AGPLv3MITMIT
核心功能统一接口、智能路由、精细计费、格式转换、权限管控渠道管理、令牌分发、额度控制模型路由、故障切换、观测监控
支持模型30+ 主流服务商(OpenAI、Claude、Gemini、DeepSeek、Midjourney、Suno 等)20+ 主流服务商100+ 模型提供商
格式转换OpenAI ↔ Claude、OpenAI → Gemini、Thinking 内容转换主要兼容 OpenAI 格式统一为 OpenAI 格式输出

New API的应用场景

AI 模型对比测试:用户通过统一接口快速切换不同厂商模型,对比 GPT、Claude、Gemini、DeepSeek 等在实际任务中的表现,辅助技术选型决策。

个人开发者建站:快速搭建私人 AI 接口中转站,统一管理多个平台的 API 密钥,通过精细计费控制个人使用成本,避免频繁切换不同服务商的繁琐操作。

创业团队产品开发:为 AI 应用提供稳定的多模型后端支持,确保产品服务高可用,同时通过数据看板监控用量和成本,优化资源配置。

企业内部 AI 中台:平台支持构建企业级 AI 资产管理系统,统一管控模型访问和费用支出,满足合规要求并提升管理效率。

做了一个 API 中转站,我才发现这行水有多深

最近刷短视频和文章,发现 API 中转站(也就是卖 token 的)火了。那么 token 是什么,是 AI 时代的燃料。

随之而来的也是各种”圈内黑话”:有人说中转站全是”水货”,拿着别的模型来滥竽充数;有人说”蒸馏卖数据”,收割一波直接跑路。说实话,这行现在乱得确实有点乱,外行看热闹,内行看门道,中间人看钱包。

其实,这玩意儿真没那么玄乎。花了半天时间,我自己也撸了一个中转平台。

核心就这几步:

  1. 1. 服务器: 选个稍微稳点的海外节点。
  2. 2. 域名: 别搞得太花哨,简单好记就行。
  3. 3. 订阅账号: 这是核心,必须是低价且稳的上游,不然扛不住。
  4. 4. 部署: 按照文档一步步走,也就半天的时间。

作为 AI 重度使用者,我手头那堆 AI 辅助工具,一会儿要 GPT 跑逻辑,一会儿要 Claude Opus 优化架构。来回切账号、挂代理、忍受那该死的 Stripe 支付报错、还得时刻担心账号被封,不挂 ISP 家庭宽带根本不行……确实是让人难受。

最关键的是额度不够用,一个账号额度 5h7d 根本不够用,多个账号还得来回切换。

自己搭个中转,主打就是一个:稳定,省心,不折腾。


01. 原理很简单,但门槛在”水面下”

API 中转站的逻辑说白了,就是”订阅转 API”。

通过购买官方的 Plus 账号或 Pro 账号,利用反代技术把网页端的会话形式(Chat)封装成标准的 API 接口。市面上主流的开源方案像 NewAPI 或者 s2a,源码谁都能用,技术门槛几乎为零。

但为什么不同家的 API 体验天差地别?

真正的门槛其实在”水面下”。首先是优质且稳定的上游号商。如果你直接去官网原价买订阅再拆开卖 token,那纯粹是在做慈善,还得贴上电费。如何在茫茫多的渠道里找到那些低价、且不容易被官方风控”连窝端”的神仙账号,才是最考验人脉和眼光的。

其次,除了正经订阅,圈子里还有很多走 Kiro,cursor,windsurf 等逆向方案过来的。还有黑产或者暴力破解的接口,虽然价格低到离谱,但用起来真的”不太行”。连接不稳定、回复被截断、甚至问着问着就断流,这种接口拿来玩玩可以,真拿来干活,分分钟想砸电脑。


02. 那些让人又爱又恨的模型

各家模型我也都测过:

  • • Claude Code:目前的”天花板”,也是最傲娇的。
    Anthropic 对国内用户的敌意真的是写在脸上的。最近 Claude Code 甚至要搞 KYC 认证,只认护照、驾照原件,复印件和照片统统拒收。圈里有个梗:说是不知道当年百度对 Anthropic 的 CEO 做了什么,让人家记恨至今。
    梗归梗,但它成本高、风控严是事实。即便如此,大家还是趋之若鹜,这真不是崇洋媚外,只有真正干活的人才知道,顶级模型那种”指哪打哪”的逻辑感,国内模型暂时还听不懂这种”人话”。
  • • GLM,qwen:怎么说呢,一言难尽。
    我之前买过它的 Coding Plan,几十块钱,确实便宜。但实际用下来,处理点简单的体力活还可以,稍微牵扯到复杂的业务逻辑,它就开始装傻。作为生产力工具,它还差点火候。
  • • OpenAI Codex:我的心头好,性价比之王。
    这是我测下来性价比最高的模型。之所以说它香,是因为它是真的能干活,不玩虚的,而且量大管饱,给的额度非常足。对于日常写代码来说,它就是那个最听话、最勤快的”赛博打工人”。

03. 聊聊 OpenClaw 和 Hermes

最近 Hermes 作为和 openclaw 经常放在一起对标的 agent,短短时间 github 就斩获了 97.3K 的 star。

说白了,Hermes 这波能火,不是靠营销吹出来的,也不是靠社区一帮人尬捧出来的,它是真把很多人最烦的那层窗户纸给捅破了:大家要的根本不是什么“会聊天”的 AI,而是一个能真正进场干活的 Agent。

为什么大家认 Hermes?核心就几点。

第一,它不是那种只会在对话框里“给建议”的花架子,它是真的能下场执行。
很多 Agent 产品嘴上说自己是智能体,结果本质上还是个高级聊天机器人:你让它改代码,它给你讲思路;你让它排查问题,它给你一堆正确的废话;你让它落地,它开始装死。Hermes 比较讨喜的一点,就是它明显更强调“动手能力”——该查文件查文件,该跑命令跑命令,该调工具调工具,不跟你整那么多虚头巴脑的。

第二,它的工程味很重,不是那种演示视频里看着很牛,真用起来一地鸡毛的东西。
真正长期写代码的人都知道,Agent 这玩意儿最难面不是“回答得像不像”,而是“在真实环境里能不能少犯蠢”。Hermes 被认可,本质上就是因为它在工程工作流里更顺:会调用工具、能拆任务、知道校验结果,出了问题也不是立刻开始一本道胡说八道。这种东西,外行可能感受不到,真正在项目里干活的人,一上手就知道差别在哪。

第三,它的“可控性”比很多同类产品强。
现在不少 Agent 最大的问题,不是不聪明,而是太飘。你一句话扔过去,它给你脑补八百公里,最后交回来一个和需求没啥关系的玩意儿。
有一个梗说的是像雇佣了一帮印度团队,总结汇报天花乱坠,情绪价值拉满,钱花了,事呢,也不能说没做。
Hermes 相对更像个能沟通的执行助手:你让它干什么,它就尽量沿着你的轨道走,而不是擅自加戏。对开发者来说,这点特别重要。因为生产环境里最怕的不是 AI 笨,最怕的是 AI 自作聪明。

至于它和 OpenClaw 的区别,我觉得一句话就能概括:
OpenClaw 更像“能力展示型选手”,Hermes 更像“上手就能干活的工兵型选手”。

OpenClaw 给人的感觉,是那种很容易让人眼前一亮的 Agent:理念新、动作猛、社区热度高,很多场景下也确实能打,属于“你一看就知道这东西有想象力”的路线。它更像是在往“更强的自主性、更完整的 Agent 形态”上冲,适合拿来探索边界,看看 Agent 到底还能卷到什么程度。

而 Hermes 这边,更容易获得一线用户的认可,恰恰不是因为它最会秀肌肉,而是因为它更务实。
它不一定每个 Demo 都最炸裂,但它更像一个你真愿意长期放进工作流里的东西。说难听点,很多产品是“发朋友圈很好看”,Hermes 这种是“你真会天天打开用”。这两者差别很大。前者是看热闹,后者是干生产。

再直白一点:
OpenClaw 更像在证明“Agent 可以有多强”,
Hermes 更像在回答“Agent 到底怎么才算好用”。

这也是为什么它能在这么短时间内积累这么高的关注度。不是因为大家突然集体情怀上头了,而是因为越来越多的人开始从“玩模型”切换到“用模型干活”。一旦进入这个阶段,评价标准就完全变了。谁更会说,不重要;谁更能稳稳把活干完,才重要。

所以 Hermes 火,不是偶然。
它踩中的其实是当下 Agent 圈最真实的痛点:少一点表演,多一点执行;少一点玄学,多一点落地;少一点“我觉得我能”,多一点“我已经帮你做了”。


04. 结语

折腾下来,API 中转站给我最大的感受是:这行的信息差实在太大了。
收了钱就跑路的、用盗刷卡账号来薅羊毛最后连累用户被封的,一抓一大把。新手进来,十个有八个要交学费。

核心逻辑就两条:

  1. 1. 别贪便宜,擦亮眼睛。 天上不会掉馅饼,掉下来的多半是陷阱。
  2. 2. 别怕折腾。 AI 这波浪潮里,工具链是核心生产力。花半天时间把自己的 API 流水线理顺,比你每天花两小时切账号、挂代理、对着报错发呆要划算得多。

普通人不会写文章?用AI+朱雀AI,10分钟出一篇安全公众号

 最近好多朋友跟我说:也想做个公众号,记录点东西、分享点干货,可就是不会写,坐在电脑前半天憋不出一句话。


    好不容易用AI生成一篇,又怕被检测出来,限流、不推荐,白忙活一场。

     其实真没那么复杂。今天就把我一直在用的完整流程分享给你,不用文笔好,不用懂排版,AI+朱雀AI,10分钟就能出一篇安全、能正常发的公众号文章。
1️⃣让AI搭框架,不写正文

     打开你常用的AI工具,直接输入指令:
    帮我写一个公众号文章大纲,主题是______,不用写完整内容,只要分小标题,每段提示大概写什么。
     AI只会给你结构:标题、开头、分点、结尾。
这一步绝对安全,因为我们只让它搭架子,不生成完整段落。

2️⃣自己填“人话”,1分钟搞定

     对着大纲,用你平时说话的语气往里填内容。
     不用华丽辞藻,不用对仗工整,怎么聊天就怎么写:
• 我自己试过
• 给大家提个醒
• 说实话我一开始也不会
• 分享一下我的心得
    哪怕每段只有两三句话,都比AI通篇生成更真实、更受欢迎。

3️⃣复制去朱雀AI检测
    把写好的内容,粘贴到朱雀AI检测里测一遍。
大部分情况,因为是你自己组织的语言,AI概率都会很低。
    就算有一两句标红,也只需要稍微换个说法,完全不用大改。

4️⃣复制到公众号,直接发布

    检测通过后,直接粘贴到公众号后台,简单分个段,加个小标题,一篇文章就完成了。

    整个流程下来,熟练之后真的10分钟足够。
    不用怕不会写,不用怕被检测,普通人也能轻松坚持更新。

     做公众号,从来不是比谁文笔更好,而是比谁更愿意坚持、更愿意真诚分享。
     如果你也想开始,今天就可以试着动手写一篇啦。

一个开源、功能强大的 AI 短剧工厂,从剧本到成片一条线搞定!

Jellyfish 是一个一站式 AI 生成短剧(竖屏短剧 / 微短剧)的生产工具,覆盖从剧本输入到智能分镜、角色/场景/道具一致性管理、AI 视频生成、后期剪辑,直至一键导出成片的完整流程。

应用场景

  • 短剧/微短剧内容创作者:快速将创意转化为高质量短剧作品。
  • AI 影视工作室批量生产:高效批量生成短剧内容,满足市场需求。
  • 个人创作者低成本试水:以较低成本尝试竖屏短剧创作。
  • 教育/培训机构:制作教学短视频,丰富教学内容和形式。
  • 品牌/电商:制作带剧情的产品宣传短片,提升产品吸引力。

功能模块

  • 剧本输入:支持多种格式的剧本输入,为后续处理提供基础。
  • 智能分镜:自动将剧本转化为可拍摄的分镜脚本。
  • 角色/场景/道具一致性管理:确保在不同镜头中角色、场景、道具的一致性。
  • AI 视频生成:对接多种大模型 API,生成高质量视频片段。
  • 后期剪辑:提供视频剪辑功能,对生成的视频进行后期处理。
  • 一键导出成片:将剪辑好的视频一键导出为成品短剧。

功能特点

  • 极致一致性:通过全局种子、统一风格、资产复用,解决 AI 生成中的人物/场景漂移问题。
  • 工业化生产流程:从文学剧本到可拍摄分镜,再到视频片段,实现一条龙闭环生产。
  • 可视化 & 可控:提供所见即所得的分镜编辑器、精细的镜头语言控制、实时预览功能。
  • 资产复用体系:全生命周期管理角色/场景/道具/服装/提示词模板,提高生产效率。

项目技术栈

前端

  • 框架:React 18 + TypeScript + Vite
  • UI 组件库:Ant Design / Tailwind CSS
  • 状态管理:Redux Toolkit / Zustand
  • 工作流编辑:React Flow
  • 视频播放器:Video.js / Plyr
  • 富文本/代码编辑:Monaco Editor / React Quill

后端(可选开源部分)

  • 框架:Node.js / NestJS / FastAPI / Spring Boot
  • 数据库:MySQL(通过 Docker Compose 启动)
  • 文件存储:RustFS(提供 S3 API 接口)

AI 生成层

  • 对接多种大模型 API,包括但不限于 OpenAI、Anthropic、Midjourney、Runway、Kling、Luma 等。