博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
网页简体变为繁体
阅读量:4494 次
发布时间:2019-06-08

本文共 1039 字,大约阅读时间需要 3 分钟。

'''     1.读取本地网页     2.匹配页面中的中文     3.转换为繁体 ''' import re from Fan_Jian.langconv import * import Fan_Jian.zh_wiki import multiprocessing import os class Fan_jian_change(object):     # 读取本地所有的网页源码文件     def read_local_web(self):         dir_name = '../file'         name_list = os.listdir(dir_name)         for name in name_list:             with open(name, 'r', encoding='utf-8') as f:                 web_data = f.readlines()         return web_data     # 将读取到的web源代码进行正则匹配,匹配出所有的汉字     # 将匹配出的简体汉字转换为繁体     def re_change(self, web_data):         sentence = Converter('zh-hant').convert(web_data)         for i in range(2):             with open('../end/{}.txt'.format(i), 'a+', encoding='utf-8') as f:                 f.write(sentence)         print('网站转换成功..')     def main(self):         web_data = self.read_local_web()         q = multiprocessing.Pool(10)         q.apply_async(self.re_change, args=(web_data,)) if __name__ == '__main__':     f = Fan_jian_change()     f.main()

转载于:https://www.cnblogs.com/victorstudy/p/11425894.html

你可能感兴趣的文章
document
查看>>
Hadoop下大矩阵乘法Version2
查看>>
iPhone内存溢出——黑白苹果
查看>>
Struts2学习笔记(十二) 类型转换(Type Conversion)(下)
查看>>
tcpdump学习
查看>>
局域网内传输文件速度慢
查看>>
Linux的核心版本(摘抄)
查看>>
CASE表达式
查看>>
zkw线段树
查看>>
作业1226
查看>>
mainline.js主线
查看>>
fseek()
查看>>
Python学习笔记——PyQt控件中文字居中显示
查看>>
JAVA环境下利用solrj二次开发SOlR搜索的环境部署常见错误
查看>>
Beta阶段敏捷冲刺前准备
查看>>
mini web框架-3-替换模板
查看>>
Siamese Network简介
查看>>
svg学习(三)rect
查看>>
ruby 模块 的引入
查看>>
CI Weekly #21 | iOS 持续集成快速入门指南
查看>>