- 详情
- 目录
- 评价2
简介:本课程由数据预处理整个流程到综合实战。包括:Anaconda、Sublime、Pywin32、数据采集、数据集成、缺失值处理、正则、jieba分词、NLTK、词袋模型、数据抽样、特征词抽取、文本向量化、gensim、数据降维、numpy、sicpy、pandas、matplotlib、seabom、Xgboost等核心技术。
第1章课程介绍
- 什么是数据预处理03分钟23秒
- 预处理流程01分钟56秒
- 为什么做这门课程01分钟56秒
- 可以学习到什么东西06分钟11秒
- 开发环境说明32秒
- 课程体系介绍04分钟23秒
第2章抽取文本信息
- 数据类型与数据采集04分钟12秒
- 文本抽取问题03分钟09秒
- 抽取word文档文本内容20分钟32秒
- 抽取PDF文档文本内容07分钟24秒
- 封装多格式的文本信息抽取工具15分钟21秒
- 遍历读取文件08分钟29秒
- 遍历文件批量抽取文本内容(1)14分钟38秒
- 遍历文件批量抽取文本内容(2)05分钟10秒
