Skip to content

BolynWang/CNKI-Download

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 

Repository files navigation

CNKI文献自动搜索工具

🚀 自动化的CNKI文献搜索工具,支持从RIS文件中提取文献信息并在CNKI网站上进行搜索。

功能特点

  • ✅ 交互式RIS文件路径输入,支持文件验证
  • ✅ 自动从RIS文件中提取文献信息
  • ✅ 智能元素定位缓存,提高搜索效率
  • 自动进入详情页并点击PDF下载 (新功能)
  • ✅ 智能回退到手动模式处理复杂情况
  • ✅ 友好的用户界面和详细的进度显示

安装依赖

pip install selenium webdriver-manager

使用方法

基本用法

# 运行程序
python cnki_search_automation.py

# 程序启动后会提示输入RIS文件路径
# 可以输入:
# - 相对路径:my_papers.ris
# - 绝对路径:/path/to/papers.ris
# - 带空格的文件名:导出的条目.ris

程序流程

  1. 程序启动: 运行程序后会显示欢迎界面
  2. 输入文件: 程序提示输入RIS文件路径,支持文件存在性验证
  3. 文件解析: 程序会自动解析指定的RIS文件,提取文献信息
  4. 文献预览: 显示找到的文献数量和前5篇文献的预览
  5. 🆕 选择范围: 输入开始和结束的文献编号 (如: 3到129)
  6. 范围确认: 显示将要处理的文献预览并确认
  7. 自动搜索: 程序会自动在CNKI上搜索指定范围的文献
  8. 智能下载: 自动进入详情页并点击PDF下载按钮
  9. 备用手动: 如果自动下载失败,提供手动下载指引
  10. 继续下一篇: 下载完成后按回车继续下一篇

特色功能

1. 智能元素定位缓存

  • 第一次搜索时会找到搜索框和搜索按钮的位置
  • 后续搜索直接使用缓存的位置,大大提高搜索速度

2. 智能文件验证

  • 支持相对路径和绝对路径
  • 自动验证文件是否存在
  • 自动去除路径中的引号
  • 对非.ris文件给出友好提示

3. 🆕 灵活的范围选择

  • 支持指定处理文献的起始和结束位置
  • 智能验证输入范围的有效性
  • 显示将要处理的文献预览和确认
  • 支持断点续处理功能

4. 🆕 智能自动下载

  • 自动进入详情页: 搜索完成后自动点击第一个搜索结果
  • 自动点击PDF下载: 在详情页面自动找到并点击PDF下载按钮
  • 智能容错处理: 如果自动下载失败,自动切换到手动模式
  • 多种选择器支持: 适应CNKI网页结构的变化

5. 人性化交互

  • 下载确认: 自动下载启动后等待用户确认完成
  • 手动备选: 提供详细的手动下载步骤指引
  • 进度显示: 清晰显示当前处理的文献和总进度

使用示例

# 启动程序
python cnki_search_automation.py

# 程序提示时输入RIS文件路径
📁 请输入RIS文件路径: my_papers.ris
✅ 找到RIS文件: my_papers.ris

# 程序显示文献总数后,选择处理范围
📚 从RIS文件中找到 129 篇文献

📋 处理范围设置 (总共 129 篇文献)
==================================================
请输入开始处理的文献编号 (1-129): 3
请输入结束处理的文献编号 (3-129): 129

✅ 确认处理范围:
   📍 起始位置: 第 3 篇
   📍 结束位置: 第 129 篇
   📊 总计处理: 127 篇文献

确认处理这 127 篇文献吗?(y/n): y

# 然后程序会自动处理指定范围的文献

注意事项

  1. 浏览器要求: 需要安装Microsoft Edge浏览器
  2. 网络连接: 确保能够访问CNKI网站
  3. 登录状态: 如果需要下载全文,可能需要登录CNKI账号
  4. 手动下载: 程序只负责搜索,下载需要手动操作

故障排除

  • 找不到搜索框: 检查CNKI网站是否有变化,或者网络连接是否正常
  • RIS文件读取失败: 确认文件路径正确,文件格式为标准RIS格式
  • 浏览器启动失败: 确认已安装Edge浏览器,或检查网络代理设置

About

自动化的CNKI文献搜索下载工具,支持从RIS文件中提取文献信息并在CNKI网站上进行搜索。

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages