自动从你关注的信息源收集内容,用 AI 生成结构化摘要,投递到你常用的平台。
English | 中文
你是否也有这样的困扰:
- 技术从业者:关注的工程博客、开源动态分散在十几个站点,英文内容读得慢,每周花几小时浏览不现实
- 研究人员:论文、行业报告、领域新闻散落各处,想追踪却总错过关键更新
- 内容创作者:需要持续跟踪行业趋势和热点,手动刷新效率太低
- 商务人士:行业资讯、竞品动态、政策变化淹没在信息洪流里,找不到重点
核心问题:信息源分散 + 语言障碍 + 时间有限 = 被动错过重要内容。
Sift 的思路:选定你的信息源 → 自动抓取 → AI 生成结构化摘要 → 投递到你常用的平台。数据源、处理逻辑、投递渠道完全解耦,按需扩展,不做大而全,做小而精。
Sources ──▶ Pipeline ◀──▶ KnowledgeStorage ◀──▶ Channels
▲
│
▼
Web UI
所有组件围绕 KnowledgeStorage(knowledge.db)交互,Pipeline 负责抓取、去重、摘要、投递。
→ 完整架构设计
git clone <repo> && cd sift
pip install -r requirements.txt
cp .env.example .env
vi .env # 填入 API_KEY 等配置
python3 sift/cli.py run # 生成第一期周报容器部署(Podman / Docker):
podman build -t sift:latest .
podman run --rm --env-file .env \
-v ./feeds.json:/app/feeds.json:ro \
-v ./output:/app/output \
-v ./knowledge:/app/knowledge \
sift:latest run可选 Web UI:
pip install -r requirements-ui.txt
streamlit run app.py→ 部署指南(GitHub Actions / 容器 / Android / 配置详解)
| 文档 | 内容 |
|---|---|
| 架构设计 | 三层管道、反馈系统、知识积累、实现方案 |
| 部署指南 | GitHub Actions、本地运行、Android、配置、订阅源管理 |
| 竞品对比 | 与 RSSHub / Folo / ClawFeed 等项目的对比 |
| Document | Content |
|---|---|
| Architecture Design | Three-layer pipeline, feedback system, knowledge accumulation, implementation details |
| Deployment Guide | GitHub Actions, local running, Android, configuration, subscription source management |
| Competitive Analysis | Comparison with RSSHub / Folo / ClawFeed and other projects |
python tests/test_all.py # 运行全部测试
python tests/test_all.py storage # 只运行 storage 组
python tests/test_all.py config # 只运行 config 组MIT