Skip to content

TonyLTalentexe/wechat-article-clipper

Repository files navigation

WeChat Article Clipper

印象笔记式微信公众号剪藏工具:把公开 mp.weixin.qq.com 文章链接转换成本地化文档包,而不是只保存一个网页链接。

它会保存:

  • 原始公开页面源码:page.html
  • 文章元信息:metadata.json
  • 图片下载清单:image_manifest.json
  • 本地图片:images/
  • 离线 Markdown 笔记:*-剪藏版.md

用途

适合把微信公众号文章长期保存到本地知识库、Obsidian、Git 仓库或其他文档系统中。

这个项目只读取公开 HTML,不登录账号,不绕过付费、权限、验证码或平台安全限制。

安装

git clone https://github.com/YOUR_NAME/wechat-article-clipper.git
cd wechat-article-clipper
python3 -m pip install -e .

也可以不安装,直接运行:

python3 src/wechat_article_clipper/clipper.py "https://mp.weixin.qq.com/s/ARTICLE_ID"

使用

wechat-article-clipper "https://mp.weixin.qq.com/s/ARTICLE_ID"

默认输出到:

~/Desktop/wechat-clips/

自定义输出目录:

wechat-article-clipper \
  "https://mp.weixin.qq.com/s/ARTICLE_ID" \
  --out-root ~/Documents/wechat-clips

成功后会打印生成的 Markdown 路径。

输出结构

文章标题-短哈希/
├── 文章标题-剪藏版.md
├── page.html
├── metadata.json
├── image_manifest.json
└── images/
    ├── 01-cover.webp
    └── 02-article.webp

Markdown 中的图片引用会被改写为本地相对路径,例如:

![封面图](images/01-cover.webp)

Codex Skill

本仓库同时包含 Codex skill 版本:

codex-skill/wechat-article-clipper/

安装到 Codex:

mkdir -p ~/.codex/skills
cp -R codex-skill/wechat-article-clipper ~/.codex/skills/

之后当用户提供微信公众号文章链接并要求“印象笔记式剪藏”“本地化 Markdown”“离线保存”时,Codex 可以直接使用该 skill。

设计边界

  • 只处理公开微信公众号文章链接或公开 HTML。
  • 不绕过登录、付费、权限、验证码或浏览器安全限制。
  • 不上传、不发布、不发送到第三方。
  • 若页面没有标准正文容器 #js_content,会停止并提示失败原因。
  • 图片下载失败时,会把失败 URL 和原因记录在 image_manifest.json

依赖

  • Python 3.10+
  • requests
  • lxml

License

MIT

About

Clip public WeChat Official Account articles into offline Markdown bundles.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages