当前位置: 首页 > news >正文

没有服务器做网站天津做网站选择津坤科技c

没有服务器做网站,天津做网站选择津坤科技c,自己做淘宝返利网站,电商网站开发参考文献背景 ​ 网页上的培训材料#xff0c;内容全是PPT页面图片。直接通过浏览器打印#xff0c;会存在只打印第一页#xff0c;并且把浏览器上无效信息也打印出来情况。但目标是希望将页面图片全部打印为pdf形式。 实现方案 利用网页“另存为”#xff0c;将页面内所有图片资…背景 ​ 网页上的培训材料内容全是PPT页面图片。直接通过浏览器打印会存在只打印第一页并且把浏览器上无效信息也打印出来情况。但目标是希望将页面图片全部打印为pdf形式。 实现方案 利用网页“另存为”将页面内所有图片资源下载到本地利用页面html源码解析出图片下载名与标准名之间对应关系格式化标准名按文件名顺序排序;按文件名顺序合并所有图片到一个pdf文件中。 技术点 利用BS4解析html文档利用PIL的Image合并图片到pdf 操作步骤 打开页面并选择“另存为”。 保存到F:\course目录下 将所有图片文件复制到tmp目录 通过分析页面图片所有有效图片都是后缀为JPG格式的图片。 运行read_html.py文件标准化tmp目录下图片文件名 1、使用img标签下的alt文件名替换tmp目录下文件名。本处实现发现下载图片文件名为src下文件名但alt属性中文件名更便于理解和排序 2、将文件名中编号规整保持3位数字。本处实现最大的序号为366名称为“幻灯片2.JPG”的会显示在“幻灯片11.JPG”的后面需要将“幻灯片2.JPG’和”幻灯片11.JPG“规整为幻灯片002.JPG和”幻灯片011.JPG“ 运行merge_img2pdf.py文件将tmp目录下所有图片合并成一个pdf文件 源代码及注释 # content of read_html.py # 解析本地html文件并将图片文件标准化命名 import re import os from bs4 import BeautifulSoupdef main():img_dict {}soup BeautifulSoup(open(个人中心-云阅读_希赛网.html)) # 读取另存为生成的html文件imgs soup.find_all(img) # 获取所有img标签for img in imgs:if len(img[alt]) 0: # 过滤掉img标签中alt属性内容为空的字段continuereal_name img[alt]if len(real_name) 9: # 标准化img文件名全部变为幻灯片XXX.JPG形式real_name real_name[0:3]0real_name[3:]elif len(real_name) 8:real_name real_name[0:3]00real_name[3:]img_dict[os.path.basename(img[src])] real_name # 构造字典,key为下载到本地的文件名value为易读的待修改后的文件名print(img_dict)os.chdir(tmp) # 切换到tmp目录下for old_file_name, new_file_name in img_dict.items():if os.path.exists(old_file_name): # 若实际文件存在才进行更名try: # 增加异常捕获alt属性名称存在同名情况有发生异常风险。os.rename(old_file_name,new_file_name) # 重命令文件except:passif __name__ __main__:main()# content of merge_img2pdf.py # 遍历tmp下所有jpg文件并在运行目录下生成pdf文件 from io import BytesIO from PIL import Image import osdef get_file_list():file_list []for file in os.listdir(): # 遍历目录下所有JPG或jpg文件并保存到file_list列表中列表中图片顺序根据文件名称排序。if file.endswith(JPG) or file.endswith(jpg):file_list.append(file)return file_listdef convert_to_pdf(file_list:list):sources []output Image.open(file_list[0]) # Image中加入第一张图片print(file_list)file_list.pop(0) # 从列表中去除第一张图片for file in file_list:file Image.open(file) # 逐张打开图片if file.mode RGB:file file.convert(RGB)sources.append(file) # 并添加到sources列表中os.chdir(..) # 返回程序运行目录output.save(output.pdf,pdf,save_allTrue,append_imagessources) # 保存图片到pdf文件中创建output时已经设置了第一张图片append_images列表中按顺序保存了其它图片内容。def main():os.chdir(tmp) # 进入tmp目录下file_list get_file_list()convert_to_pdf(file_list)if __name__ __main__:main()后续优化 目前是通过命令行方式运行可以考虑通过pyside6做页面。当前只适配了希赛一个网站根据后续需求增加程序的适配图片格式。
http://www.huolong8.cn/news/39497/

相关文章:

  • 房地产网站设计方案国外企业网站模板
  • 西安免费做网站电话网站模板怎么用
  • 阜阳网站建设费用ps网站首页设计图
  • 如何进入网站后台管理系统易企网站建设公司
  • 国外最火的网站网站开发工程师是什么内容
  • 海南住房和城乡建设厅网站登陆完整的品牌推广方案
  • dedecms怎么关闭网站网站建设全视频教程下载
  • 建立网站要什么条件和多少钱廊坊关键词优化服务
  • 揭阳制作公司网站企业外贸网络推广
  • 网站文章页图片不显示苏州建设监理有限公司网站
  • 网站建设与管理读书心得课程网站建设内容
  • 妇科医院手机网站wordpress 租赁主题
  • 推广型网站制作哪家好电商网站竞价推广策略
  • 优设设计网站导航深圳十大穷人区
  • 绿色软件园济南网站搜索优化
  • 网站空间公司api网站模板
  • 家装网站模板下载制作网站吗
  • 教师做爰网站网站开发的最后五个阶段
  • 服装官网网站建设网站建设彩票网
  • 杭州企业网站设计制作宣传方式
  • 眉县做网站wordpress播放没声音
  • 婚庆类网站模板网页设计师培训机构费用价格多少
  • 域名备案进度查询哪里有做网站排名优化
  • 做ppt的模板网站在网站和网页的区别
  • 槐荫区网站建设百度指数移动版怎么用
  • 微信做商城网站发软文是什么意思
  • 淘宝做链接的网站wordpress 打赏js
  • wordpress微信站网站建设与网页设计入门
  • 如何建立网站建设规划建立网站报价
  • 做装修网站卖钱网站网页转app源码