为了解决文本中标点符号太乱的问题而尝试进行的微小项目
v0.1:实现简单需求,扩展性不强,考虑进一步调整
-提取指定文本,按自定规则对文本中出现的不合规标点符号进行批量调整
(详情参照使用说明)
- 对经过修改的文本,标出其所在位置、原文本和修改后文本以方便对照
- 将待处理文件放在程序根目录下
-python main.py
- 结果放置于/output目录内
- 如果运行不成功,确认文本是否是UTF-8编码
- 程序不会修改原文本,但考虑到试作版稳定性,请做好源文件备份工作
- 暂不支持多行修改(例如跨行引号等)
- 目前只识别.txt文件
- 加入标点自定义功能
- 加入人称等专有名词匹配替换功能