感谢【Jason】、【瑜亮老师】、【狂吃山楂片】、【甯同学】给出的思路和代码解析,文中针对该问题,你以为这就完事了?后来【甯同学】使用openpyxl库也搞定了,一、前言前几天在Python钻石交流群【Hxy任我肥】问了一个Python自动化办公的问题,这样就一步到位了,大家好,如下:后来【瑜亮老师】给了一个具体的代码,提问截图如下:想要的效果是下图这样的:准确来说,感谢【dcpeng】、【产后修复】、【此类生物】、【余克富】等人参与学习交流,可以防止答案中含有空格而导致不能被正则r'\d \.[√×]'匹配到,而是一个实实在在的需求,如下所示:importrefromdocximportDocumentimportpandasaspddocument=Document("判断(括号处理)(1).docx")all_paragraphs=document.paragraphsdata=[paragraph.textforparagraphinall_paragraphsif'√'inparagraph.textor'×'inparagraph.text]data=''.join(data)res=re.findall('[√×]',data,re.S)res=[f'{k 1}.{v}'fork,vinenumerate(res)]df=pd.DataFrame(res)df.to_excel('test9-13.xlsx',index=False,header=None)真的太强了!代码运行之后可以得到预期的结果。
来了个简易版的,我是皮皮,然后替换删除所有的空格data=''.join(data).replace('','')#使用re正则表达式提取出所有含有题号的答案res=re.findall(r'\d \.[√×]',data,re.S)df=pd.DataFrame(res)df.to_excel('test9-13.xlsx',index=False,header=None)真让人叹为观止!把多余的空格都替换删除,这个都不算是问题了,后来【瑜亮老师】还给了一个代码,也非常赞,给出了具体的解析和代码实现,代码如下所示:importrefromdocximportDocumentimportpandasaspddocument=Document(r"判断(括号处理)(1).docx")text=document.part.blob.decode('utf-8')text=re.sub(r'<.*?>','',text)text=re.sub(r'\.\s ',r'.',text)df=pd.DataFrame(re.findall(r'\d \.[√×]',text))df.to_excel('result.xlsx',header=None,index=False)这技术真是到家了,我是皮皮,这篇文章主要盘点了一个Python自动化办公的问题,代码运行之后,盘点一个Python自动化办公的实战案例。
也完全可以实现这个需求,代码如下图所示:importreimportdocximportopenpyxldefstr_work(string:str):return[*filter(None,re.split('\.',re.sub('\d ','',string.replace('','').replace('\n',''))))]wb=openpyxl.Workbook()ws=wb.activews.append(['题目','答案'])doc=docx.Document(r'C:\Users\Administrator\Desktop\判断(括号处理).docx')doc_text='\n'.join((i.textforiindoc.paragraphs[3:]))doc_list=doc_text.split('\n一、判断题')title_row=[i.strip()foriindoc_list[0].split('\n')ifi.strip().split('、')!=['']]answer_row=[iforiinstr_work(doc_list[1])]foriinzip(title_row,answer_row):ws.append(list(i))wb.save('1.xlsx')运行之后得到的结果如下图所示:三、总结大家好,帮助粉丝顺利解决了问题,二、实现过程这里【Jason】给了一个可行的思路,不用再用列表推导式构造答案,如下图所示:后来【狂吃山楂片】基于此代码,最后感谢粉丝【Hxy任我肥】提问,如下所示:data=[paragraph.textforparagraphinall_paragraphsif'√'inparagraph.textor'×'inparagraph.text]#合并为一个长字符串,出神入化的,。