1.油箱加满准备出发——准备工作
1.1 开发环境
1.2 学会debug万事不求人——调试程序代码
1.3【动手实践】1:找出列表中的奇数
1.4 【作业】1:你能帮我找出哪儿出了问题吗?
2.让“虫子”帮你收集数据——网络爬虫技术
2.1 数据搜集
2.2 【动手实践】2:国家数据网站提供下载数据
2.3 【作业】2:搜集贵州茅台股票历史交易数据
2.4 爬取数据-抓包软件分析网络请求
2.5【动手实践】3:爬取贵州茅台股票数据
2.6 解析数据-使用BeautifulSoup(美汤)库
2.7 【动手实践】4:美汤解析贵州茅台股票数据
2.8 使用Selenium工具
2.9 【动手实践】5:使用Selenium爬取茅台股票数据
2.10 使用线程提高爬虫工作效率
2.11 【动手实践】6:同时爬取多只股票数据
2.12 【作业】2:按月爬取一年的股票数据
3.洗一洗“脏数据”——数据清洗
3.1 数据清洗那些事
3.2 访问Excel文件库——xlwings
3.2.1 xlwings库中对象层次关系
3.2.2【动手实践】7: 打开Excel文件读取单元格数据
3.2.3 如何获得表格区域
3.2.4 获得表格行数和列数
3.2.5 转置表格
3.2.6 单元格默认数据类型
3.2.7 写入单元格数据
3.2.8 删除行或列
3.2.9 调用VBA宏批量删除重复数据
3.3 填充缺失值
3.4 调用Excel内置函数计算平均值
3.5【作业】3:将股票数据放到Excel文件
4.把“宝贝”收好了!——数据存储
4.1 读写CSV 文件
4.1.1【动手实践】7:读取贵州茅台股票历史交易.csv文件
4.1.2【动手实践】8: 将爬取的数据保存为CSV文件
4.2 SQLite 数据库
4.3 使用 GUI 管理工具管理 SQLite 数据库
4.4 sqlite3 模块 API
4.5 【动手实践】9:将爬取的股票数据保存到 SQLite 数据库
4.6 【动手实践】10:在数据库中查询数据
5.找出隐藏在数据中的“黄金屋”——数据分析
5.1 使用Excel进行数据分析
5.1.1 【动手实践】11:找出北京周边的房价信息
5.1.2【动手实践】12: 找出北京周边房屋面积大于 120平米的小区
5.1.3 动手实践】13:找出东城区和西城区房屋面积大于 120平米的小区
5.1.4【动手实践】14:找出北京最高房价的小区
5.2 使用pandas库
5.2.1 使用 Jupyter Notebook开发工具
5.2.2 【动手实践】15:从 Excel 文件中读取全国总人口数据
5.2.3 pandas访问CSV文件
5.2.4 pandas访问SQLite
5.2.5 使用 pandas 库写入数据到 CSV 文件
5.2.6 使用 pandas 库写入数据到 Excel 文件
5.2.7【动手实践】16:找出北京各城区有最高房价的小区
5.2.8【动手实践】17:按照各城区的平均房价排序
5.3 数据分析与数据透视表
6.一图抵万言——数据可视化
6.1 使用Matplotlib绘制图表
6.1.1【动手实践】18: 绘制城区最高房价柱状图
6.1.2 北京房价区间占比饼状图
6.1.3 北京各城区房价分布散点图
6.1.4 贵州茅台股票的历史成交量折线图
6.1.5 绘制股票的历史 OHLC 图
6.2 调用Excel绘制图表
6.2.1 绘制三维折线图
6.2.2【动手实践】19: 绘制三维簇状条形图
7.办公离不开的字处理——操纵Word文件
7.1 访问Word文件库——python-docx
7.1.1 python-docx 库中的那些对象
7.1.2【动手实践】20: 打开 Word 文件并读取内容
7.1.3【动手实践】21: 写入数据到 Word 文件
7.1.4 在 Word 文件中添加表格
7.1.5 设置文件样式
7.1.6 修改文件样式
7.2 解决在工作中使用 Word 时遇到的问题
7.2.1【问题】1:批量转换.doc 文件为.docx 文件
7.2.2【问题】2: 采用模板批量生成证书文件
7.2.3【问题】3:批量统计文件页数和字数
7.2.4【问题】4: 批量转换 Word 文件为 PDF 文件
8.演示利器PPT——操纵PowerPoint文件
8.1 访问PPT文件库python-pptx
8.1.1【动手实践】25: 创建 PPT文档
8.1.2【动手实践】26: 添加更多的幻灯片
8.1.3【动手实践】27: 在 PPT 幻灯片中添加表格
8.1.4【动手实践】28: 在 PPT 幻灯片中添加图表
8.2 解决在工作中使用 PPT时遇到的问题
8.2.1【问题】1:批量转换.ppt 文档为.pptx 文档
8.2.2【问题】2: 批量转换 PPT 文档为 PDF 文件
9.跨平台的文件格式——操纵PDF文件
9.1 PDF 文件的优势
9.2 操作PDF文件库——pypdf2
9.2.1pypdf2库中的对象
9.2.2【动手实践】29: 读取 PDF 文件的内容
9.2.3【动手实践】30: 拆分 PDF 文件
9.2.4【动手实践】31:用更多的方法拆分 PDF 文件
9.2.5【动手实践】32:合并 PDF 文件
9.2.6【动手实践】33:对 PDF 文件批量添加水印
9.2.7【动手实践】34:批量加密 PDF 文件
9.2.8【动手实践】35:批量解密 PDF 文件
9.2.9【动手实践】36:暴力破解 PDF 文件的密码
9.3 解析PDF文件库——pdfplumber
9.3.1【动手实践】37: 提取 PDF 文件中的文本信息
9.3.2【动手实践】38: 提取 PDF 文件中的表格信息