当前位置:首页 > 数码 >

tmp文件怎么转换成excel(怎么把tmp变成excel)

来源:原点资讯(m.360kss.com)时间:2024-04-20 02:19:34作者:YD166手机阅读>>

tmp文件怎么转换成excel,怎么把tmp变成excel(1)

tmp文件怎么转换成excel,怎么把tmp变成excel(2)

一.根据客户需求把文件夹里所有的Word文档转换成Excel格式

Wrod格式如下:

tmp文件怎么转换成excel,怎么把tmp变成excel(3)

tmp文件怎么转换成excel,怎么把tmp变成excel(4)

转换后Excel格式如下:

tmp文件怎么转换成excel,怎么把tmp变成excel(5)

具体要求:word文档中带有5位数字1行转为,序号和方名各1列,后面对应带有【】标签里的内容各1列。如果方名下一行没有含有【】的,数据单独放在备注那1列。有的时候同1个【】内容,会持续两段。需要重新放在一起。

整体思路:带方号的行均保护5位数字,可用正则匹配方号和方名,不包含5位数字的行再次判断是否包含‘【】’,包含‘【】’的行用正则匹配中间的所有字符就是列名,不包含5位数字也不包含‘【】’的行就是需要放备注的内容

实施步骤:

1.导入库

import docx import os import re import pandas as pd

2.收集所有word文件名

#指定word文件存放的文件夹 input_path=os.path.join(os.getcwd(),"word") #遍历文件夹中所有word文件名 f_lst=os.listdir(input_path) f_lst

3.生成模板表

#生成模板表和EXCEL列名 cols=["组成","用法","功用","主治","备考","方论","方论选录","方药","功能","功效","加减","禁忌","临床报道","临床举例","实验研究","现代研究","宜忌","异名","制法"] df=pd.DataFrame({"序号":[],"方名":[]}) moban=df.copy() moban

4.核心代码

def word2excel(input_path,f_name,df): #读取word文档 doc = docx.Document(os.path.join(input_path,f_name)) #行计数 count=0 #遍历word文档中所有行 for paragraph in doc.paragraphs: #判断行是否包含5位数字 if len(re.findall("^[0-9]{5}", paragraph.text))>0: #正则匹配5位数赋值给变量序号 result = re.findall("[0-9]{5}", paragraph.text) df.loc[count,"序号"]=result[0] #正则匹配5位数后面所有字符赋值给变量方名 result2 = re.findall("[0-9]{5}(.*)", paragraph.text) df.loc[count,"方名"]=result2[0] #换行 count =1 #print(paragraph.text) #不包含5位数字的行再次判断是否包含‘【】’ elif len(re.findall("[【](.*)[】]", paragraph.text))>0: #print(paragraph.text) #包含‘【】’的行用正则匹配中间的所有字符 result1 = re.findall("[【](.*)[】]", paragraph.text) #判断是否在列名数组中 if result1[0] in cols: #正则匹配‘】’后所有字符并写入对应列行 result3 = re.findall("[】](.*)", paragraph.text) df.loc[count-1,result1[0]]=result3 #不包含5位数字也不包含‘【】’的行 else: #判断是否为空 if len(paragraph.text)>0: #写入备注 df.loc[count-1,"备注"]=paragraph.text #print(paragraph.text) return df

5.依次对所有文档进行处理并保存

for i in f_lst: tmp_df=word2excel(input_path,i,moban) df=pd.concat([df,tmp_df]) df.to_excel("1.xlsx")

二.根据客户需求把txt文档中内容替换成excel中的知道内容

tmp文件怎么转换成excel,怎么把tmp变成excel(6)

#导入库 import xlrd def delblankline(infile, outfile): #打开指定文本文件 infopen = open(infile, 'r', encoding="utf-8") # 新建指定文本文件 outfopen = open(outfile, 'w', encoding="utf-8") # 打开指定EXCEL文件 wb = xlrd.open_workbook("2.xlsx") sh = wb.sheet_by_name("Sheet1") #查看总行 print(sh.nrows) #遍历所有行 db = infopen.read() for i in range(0, sh.nrows): #得到A、B列数据 name1 = sh.cell(i, 0).value name2 = sh.cell(i, 1).value print(name1) #查找替换数据 db = db.replace(name1, name2) print(i) outfopen.write(db) infopen.close() outfopen.close() delblankline("2.txt", "02.txt") print("完成")

栏目热文

怎么一次性提取文件名(怎么批量提取文件名字)

怎么一次性提取文件名(怎么批量提取文件名字)

私信回复关键词【工具】~获取Excel高效小工具合集!让你的Excel效率开挂~众所周知,「复制粘贴」可以解决 Exce...

2024-04-20 01:55:06查看全文 >>

怎么提取文件名(如何提取所有文件的文件名)

怎么提取文件名(如何提取所有文件的文件名)

小伙伴们好啊,今天咱们分享一个简单实用的Excel小技巧,快速提取文件夹内的所有文件名称。方法一:打开需要提取名称的文件...

2024-04-20 02:15:53查看全文 >>

如何快速提取所有文件名(批量提取文件名的简单方法)

如何快速提取所有文件名(批量提取文件名的简单方法)

关注职场办公,分享实用干货,洞察科技资讯!大家好,这里是职场科技范~在职场办公中,假如有一份紧急的任务交给你,半小时之内...

2024-04-20 02:02:01查看全文 >>

一键提取文件名和路径(批量提取文件名的简单方法)

一键提取文件名和路径(批量提取文件名的简单方法)

如何快速列出文件夹下面的所有文件?(包括文件名和路径)今天分享一个新技能给大家!下图中,左边是我们本次测试的文件夹,里面...

2024-04-20 02:16:37查看全文 >>

文件簿里文件名提取(提取文件夹文件名到表格)

文件簿里文件名提取(提取文件夹文件名到表格)

如何提取某个文件夹中的所有文件名?在文章:,通过使用Files函数,提取指定文件夹下的所有或特定类型的文件名。这个方法有...

2024-04-20 01:53:50查看全文 >>

tmp文件怎么用cad打开(cadtmp文件怎么恢复成原来的格式)

tmp文件怎么用cad打开(cadtmp文件怎么恢复成原来的格式)

在我们实际工作中很多时候,我们在绘图时经常没有及时保存文件,电脑突然断电或者死机,那么之前我们所有的付出就白费了,所以...

2024-04-20 02:26:17查看全文 >>

tmp文件如何恢复(tmp文件恢复后不是原来的文件了)

tmp文件如何恢复(tmp文件恢复后不是原来的文件了)

在所有Linux系统上,/tmp目录的内容都会在引导时或本地系统关闭时被删除(清除)。这是系统管理的一个标准过程,目的是...

2024-04-20 01:50:23查看全文 >>

清明当天不能干什么(清明当天不做这三件事儿)

清明当天不能干什么(清明当天不做这三件事儿)

2024年清明节的假期已经公布了,没有任何的悬念又是三天,并且还是调休得来的。唯一的变化,就是今年的清明节假期是从4月4...

2024-04-20 01:40:18查看全文 >>

清明节十大禁忌(清明节有哪些禁忌你知道)

清明节十大禁忌(清明节有哪些禁忌你知道)

清明节,又称踏青节、行清节、三月节、祭祖节等,是中华民族古老的节日,也是最重要的祭祀节日之一,是祭祖和扫墓的日子。然而,...

2024-04-20 02:07:14查看全文 >>

文档排行