🚀 自动化的CNKI文献搜索工具,支持从RIS文件中提取文献信息并在CNKI网站上进行搜索。
- ✅ 交互式RIS文件路径输入,支持文件验证
- ✅ 自动从RIS文件中提取文献信息
- ✅ 智能元素定位缓存,提高搜索效率
- ✅ 自动进入详情页并点击PDF下载 (新功能)
- ✅ 智能回退到手动模式处理复杂情况
- ✅ 友好的用户界面和详细的进度显示
pip install selenium webdriver-manager# 运行程序
python cnki_search_automation.py
# 程序启动后会提示输入RIS文件路径
# 可以输入:
# - 相对路径:my_papers.ris
# - 绝对路径:/path/to/papers.ris
# - 带空格的文件名:导出的条目.ris- 程序启动: 运行程序后会显示欢迎界面
- 输入文件: 程序提示输入RIS文件路径,支持文件存在性验证
- 文件解析: 程序会自动解析指定的RIS文件,提取文献信息
- 文献预览: 显示找到的文献数量和前5篇文献的预览
- 🆕 选择范围: 输入开始和结束的文献编号 (如: 3到129)
- 范围确认: 显示将要处理的文献预览并确认
- 自动搜索: 程序会自动在CNKI上搜索指定范围的文献
- 智能下载: 自动进入详情页并点击PDF下载按钮
- 备用手动: 如果自动下载失败,提供手动下载指引
- 继续下一篇: 下载完成后按回车继续下一篇
- 第一次搜索时会找到搜索框和搜索按钮的位置
- 后续搜索直接使用缓存的位置,大大提高搜索速度
- 支持相对路径和绝对路径
- 自动验证文件是否存在
- 自动去除路径中的引号
- 对非.ris文件给出友好提示
- 支持指定处理文献的起始和结束位置
- 智能验证输入范围的有效性
- 显示将要处理的文献预览和确认
- 支持断点续处理功能
- 自动进入详情页: 搜索完成后自动点击第一个搜索结果
- 自动点击PDF下载: 在详情页面自动找到并点击PDF下载按钮
- 智能容错处理: 如果自动下载失败,自动切换到手动模式
- 多种选择器支持: 适应CNKI网页结构的变化
- 下载确认: 自动下载启动后等待用户确认完成
- 手动备选: 提供详细的手动下载步骤指引
- 进度显示: 清晰显示当前处理的文献和总进度
# 启动程序
python cnki_search_automation.py
# 程序提示时输入RIS文件路径
📁 请输入RIS文件路径: my_papers.ris
✅ 找到RIS文件: my_papers.ris
# 程序显示文献总数后,选择处理范围
📚 从RIS文件中找到 129 篇文献
📋 处理范围设置 (总共 129 篇文献)
==================================================
请输入开始处理的文献编号 (1-129): 3
请输入结束处理的文献编号 (3-129): 129
✅ 确认处理范围:
📍 起始位置: 第 3 篇
📍 结束位置: 第 129 篇
📊 总计处理: 127 篇文献
确认处理这 127 篇文献吗?(y/n): y
# 然后程序会自动处理指定范围的文献- 浏览器要求: 需要安装Microsoft Edge浏览器
- 网络连接: 确保能够访问CNKI网站
- 登录状态: 如果需要下载全文,可能需要登录CNKI账号
- 手动下载: 程序只负责搜索,下载需要手动操作
- 找不到搜索框: 检查CNKI网站是否有变化,或者网络连接是否正常
- RIS文件读取失败: 确认文件路径正确,文件格式为标准RIS格式
- 浏览器启动失败: 确认已安装Edge浏览器,或检查网络代理设置