Skip to content

yigedinglia/puncMarkTextProcess

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

puncMarkTextProcess

为了解决文本中标点符号太乱的问题而尝试进行的微小项目
v0.1:实现简单需求,扩展性不强,考虑进一步调整

基本功能

标点修正

-提取指定文本,按自定规则对文本中出现的不合规标点符号进行批量调整
(详情参照使用说明)

日志打印

  • 对经过修改的文本,标出其所在位置、原文本和修改后文本以方便对照

运行方法

  • 将待处理文件放在程序根目录下
    - python main.py
    - 结果放置于 /output 目录内

注意事项

  • 如果运行不成功,确认文本是否是UTF-8编码
    - 程序不会修改原文本,但考虑到试作版稳定性,请做好源文件备份工作
    - 暂不支持多行修改(例如跨行引号等)
    - 目前只识别.txt文件

未来方向

  • 加入标点自定义功能
    - 加入人称等专有名词匹配替换功能

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages