当前位置：和泉文库 > 经济 > 浏览文档

中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第9章金融数据的爬虫

文件格式：PPTX，文件大小：16.28MB，售价：8.57元

文档详细内容（约39页）

网络爬虫之信息获取CurlRequests库信息获取Selenium库信息网API获取络能虫BeautifulSoup库XPath信息解析正则表达式网络爬虫包含信息两部分内容解析通常来说，Pvthon中有三种不同的方法来获取网页的源代码（其中包含我们所需要的所有信息），分别是Curl、Requests库和Selenium库；调用AP接口也是常用的信息获取方式

网络爬虫之信息获取信息获取网络爬虫包含两部分内容信息解析通常来说，Python中有三种不同的方法来获取网页的源代码（其中包含我们所需要的所有信息），分别是Curl、Requests库和 Selenium库；调用API接口也是常用的信息获取方式

Curl方法代码演示Curl是用于在命令行或脚本中进行数据传输的工具，可以获取服务器#Curl命令的基础语法（命令行窗口运行）#获取某网页内容：返回的信息，其中包含我们需要进curlwww.baidu.com行解析和提取的源代码#打印请求和响应的相关信息：curl-vwww.baidu.com#抓取网页并写入文件：利用Curl命令可以完成网页的请求?curl-ohome.htmlhttp://www.sina.com.cncurl-Ohttp./www.mvdomain.com/linux/index.html响应过程，并且将返回的结果进行#有关curl命令的帮助文件解析和存储curl-h

Curl方法 ◆ Curl是用于在命令行或脚本中进行数据传输的工具，可以获取服务器返回的信息，其中包含我们需要进行解析和提取的源代码 ◆ 利用Curl命令可以完成网页的请求- 响应过程，并且将返回的结果进行解析和存储 #Curl命令的基础语法（命令行窗口运行） #获取某网页内容： curl www.baidu.com #打印请求和响应的相关信息： curl -v www.baidu.com #抓取网页并写入文件： curl -o home.html http://www.sina.com.cn curl -O http://www.mydomain.com/linux/index.html #有关curl命令的帮助文件 curl -h ◆ 代码演示

Requests库-GET方法在爬虫的信息获取阶段，Requests库是使用最广泛使用的库之一◆实际中使用的是Requests库中的.geto方法和.posto方法代码演示首先通过.get0方法，我们获取了百度首页的源代码，并存储在r对象中#GET方法的基本用法importrequests通过状态码r.statuscode=200可知r=requests.get(https://www.baidu.com/)返回结果为成功。print(type()print(r.status_code)若要显示返回内容，则利用print(r.content.decode(utf-8))r.content.decode(utf-8')进行解码，即可得到百度首页源代码

Requests库-GET方法 ◆ 在爬虫的信息获取阶段，Requests库是使用最广泛使用的库之一 ◆ 实际中使用的是Requests库中的.get()方法和.post()方法 ◆ 代码演示 #GET方法的基本用法 import requests r = requests.get('https://www.baidu.com/') print(type(r)) print(r.status_code) print(r.content.decode('utf-8')) 首先通过.get()方法，我们获取了百度首页的源代码，并存储在r对象中。通过状态码r. status_code=200可知，返回结果为成功。若要显示返回内容，则利用 r.content.decode(‘utf-8’)进行解码，即可得到百度首页源代码

点击进入文档下载页（PPTX格式）

共39页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第13章大数据分析
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第11章大数据在银行领域的应用
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第8章文本分析及其在金融运用
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第7章人工神经网络
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第5章回归分析及其在金融运用
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第6章树类分析及其在金融运用
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第3章关联规则分析及其金融运用
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第2章金融大数据的降维
中央财经大学：《金融科技学》课程教学课件（PPT讲稿）第7章人工智能、深度学习与自然语言处理
中央财经大学：《金融科技学》课程教学课件（PPT讲稿）第6章大数据与机器学习原理
中央财经大学：《金融科技学》课程教学课件（PPT讲稿）第14章金融科技风险及其管理
中央财经大学：《金融科技学》课程教学课件（PPT讲稿）第16章金融科技监管与监管科技
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第4章聚类分析及其在金融运用
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第10章其他机器学习理论
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第12章大数据在证券投资领域的运用
中央财经大学：《大数据金融》课程教学课件（PPT讲稿）第1章大数据金融的基本原理
东莞理工学院：《中级财务会计2》课程教学大纲（2024-2025第一学期）
东莞理工学院：《宏观经济学》课程教学大纲（2024-2025第一学期）
东莞理工学院：《金融市场》课程教学大纲（2024-2025第一学期）
东莞理工学院：《宏观经济学》课程教学大纲（2024-2025第一学期）
东莞理工学院：《产业分析》课程教学大纲（2024-2025第一学期）
东莞理工学院：《金融产品分析及应用》课程教学大纲（2024-2025第一学期）
东莞理工学院：《财务报表分析》课程教学大纲（2024-2025第一学期）
东莞理工学院：《财务管理》课程教学大纲（2024-2025第一学期）

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录