数据科学引论-Python之道 第3课Python简介 一、Python介绍 让我们通过jupyter的notebook来学习Python的入门知识。我们先来看一 下notebook如何使用,如果想要运行一个代码段,我们只需将鼠标或者光标移 动至这个代码段所在的ce‖,也就是灰色的部分内,然后按下shit或ctl+回车 键就可以得到代码执行的结果。这里,1+1的结果输出为2。 快速入门 想要运行一个代码段(c),可似使用以下快捷键 ·Cf+Engr ·SnM+Enter 轮到你了: 0u112 我们为什么要使用Python呢?我们提到过Python简单易学,非常适合于新 手。Python和网页应用,也就是我们所说的Web应用以及数据库的集成性非 常好。它拥有很多优秀的数据处理的包,这些包在后续的课程当中都会使用到。 最简单的Python语句,就是在屏幕上输出一条信息。要注意的是,我们所使用 的Python环境是Python3。如果你要使用Python2的环境,那么相应的语句可 能会有一些差异,需要做修改。就像在这里,我们希望在屏幕上输出一条信息, 使用的是print语句,在Python3中是要用小括号将需要打印的内容括起来的, 而在Python2中是不需要的。我们执行这段脚本,就会看到在屏幕上输出了一条 信息
数据科学引论-P瀌瀇濻瀂瀁 之道 第 3 课 P瀌瀇濻瀂瀁 简介 一、P瀌瀇濻瀂瀁 介绍 让我们通过 濽瀈瀃瀌瀇濸瀅 的 瀁瀂瀇濸濵瀂瀂濾 来学习 P瀌瀇濻瀂瀁 的入门知识。我们先来看一 下 瀁瀂瀇濸濵瀂瀂濾 如何使用,如果想要运行一个代码段,我们只需将鼠标或者光标移 动至这个代码段所在的 濶濸濿濿,也就是灰色的部分内,然后按下 瀆濻濼濹瀇 或 濶瀇瀅濿 +回车 键就可以得到代码执行的结果。这里,1+1 的结果输出为 2。 我们为什么要使用 P瀌瀇濻瀂瀁 呢?我们提到过 P瀌瀇濻瀂瀁 简单易学,非常适合于新 手。 P瀌瀇濻瀂瀁 和网页应用,也就是我们所说的 W濸濵 应用以及数据库的集成性非 常好。它拥有很多优秀的数据处理的包,这些包在后续的课程当中都会使用到。 最简单的 P瀌瀇濻瀂瀁 语句,就是在屏幕上输出一条信息。要注意的是,我们所使用 的 P瀌瀇濻瀂瀁 环境是 P瀌瀇濻瀂瀁3。如果你要使用 P瀌瀇濻瀂瀁2 的环境,那么相应的语句可 能会有一些差异,需要做修改。就像在这里,我们希望在屏幕上输出一条信息, 使用的是 瀃瀅濼瀁瀇 语句,在 P瀌瀇濻瀂瀁3 中是要用小括号将需要打印的内容括起来的, 而在 P瀌瀇濻瀂瀁2 中是不需要的。我们执行这段脚本,就会看到在屏幕上输出了一条 信息
Python:介绍 为什么使用Python'? ·与网页应用和故据库集成性好 ·拥有优秀的数据处理包的支特,比知numpy/scipy(科学计算)、pandes(抵处理)、matplotlib(图像处理)、scl-earm(机器学习 Int2it#python2环下执行:Pr1nt"WeI ome to Python Bootean即" print "Welcome to Python Booteamp!') Welcome to Python Bootcampl 在Python语言中,以及在其他的编程语言中,我们经常会用到变量。变量 是一种内存结构,它在内存中用于存储我们执行计算时所产生的结果,这个内存 存储的结果可以在后续的代码中继续得到使用。Python的变量和有些语言的使 用方式不太一样,不需要声明就可以直接使用,因为Python会自动为这些变量 进行声明,就像下面这段代码,我们希望创建两个变量a和b,对a赋值为1, 对b赋值为2,并且输出a的值。变量a和b在之前并没有声明过,但是当Python 语言执行器执行到这里的时候,它会将a和b识别为是需要定义的变量,所以就 声明了这两个变量,然后把1和2的值分别赋给了它们。 给变量眠值: ·变量不需要声明,yhon会自动声明 ·兽于符号(】用于赋值 In【3j:a=1 B2 out[31:1 这里要注意等号,在编程语言里表示的是赋值,我们定义了这两个变量之后, 紧接着要求输出a的值,执行这段代码,就会发现确实a的值被赋予了。 你可以剩除一个对象,但是之后再使用这个变量的时候就会报错 In [4]:del b b 时ameError Traceback (most recent call last) <ipython-input-4-b24ab7427bb0>in <module>() NameError:name 'b'is not defined 刚才我们提到了变量实际上是在内存中的一种结构,它存储着计算的结果, 因此在变量不再需要使用的时候,我们应该尽量把它们都删除掉,这样节约内存。 对于删除掉的变量,它在内存当中就不再具有空间,所以如果再用它的名字去访 问,就会报错。例如,我们在这里删除了变量b,如果我们再次希望访问b,由
在 P瀌瀇濻瀂瀁 语言中,以及在其他的编程语言中,我们经常会用到变量。变量 是一种内存结构,它在内存中用于存储我们执行计算时所产生的结果,这个内存 存储的结果可以在后续的代码中继续得到使用。P瀌瀇濻瀂瀁 的变量和有些语言的使 用方式不太一样,不需要声明就可以直接使用,因为 P瀌瀇濻瀂瀁 会自动为这些变量 进行声明,就像下面这段代码,我们希望创建两个变量 濴 和 濵,对 濴 赋值为 1, 对 濵 赋值为 2,并且输出 濴 的值。变量 濴 和 濵 在之前并没有声明过,但是当 P瀌瀇濻瀂瀁 语言执行器执行到这里的时候,它会将 濴 和 濵 识别为是需要定义的变量,所以就 声明了这两个变量,然后把 1 和 2 的值分别赋给了它们。 这里要注意等号,在编程语言里表示的是赋值,我们定义了这两个变量之后, 紧接着要求输出 濴 的值,执行这段代码,就会发现确实 濴 的值被赋予了。 刚才我们提到了变量实际上是在内存中的一种结构,它存储着计算的结果, 因此在变量不再需要使用的时候,我们应该尽量把它们都删除掉,这样节约内存。 对于删除掉的变量,它在内存当中就不再具有空间,所以如果再用它的名字去访 问,就会报错。例如,我们在这里删除了变量 濵,如果我们再次希望访问 濵,由
于b已经被删除,所以就会出错。这里我们看到,执行的结果是表示名字b并未 被定义。 二、数学操作与变量 下面就让我们通过一个样例数据集来开始学习Python语言。这个样例数据 集是从网上下载的有关电影原声碟的一些数据信息。通过对这个数据集的内容进 行研究,就可以回答一些像哪个风格的专辑卖得销量最好,或者是谁的专辑的评 分最高的问题。这个数据集包含了若干列,包括艺术家的名字、专辑的名字、发 行年代、长度、音乐的类型等等。通过对这个数据集进行处理就可以得到我们想 要的一些结果。 Music Claimed recording Rating Artist Album Released Length Genre sales Released Soundtrack sales (friends) (millions) (millions) Michael 30-Nov- Thriller 1982 00:42:19 Pop,rock,R&B 65 e 10.0 Jackson Back in AC/DC 1980 00:42:11 Hard rock 26.1 25-Ju-80 8.5 Black The Dark Pink 01-Mar- Side of the 1973 00:42:49 Progressive rock 24.2 45 9.5 Floyd 73 Moon Whitney The Soundtrack/R&B, 1992 00:57:44 26.1 50 25-Jul-80 7.0 Houston Bodyguard soul,pop Bat Out of Hard rock, 21-0ct Meat Loaf 1977 00:4633 20.6 43 7.0 Hell progressive rock 77 Their Greatest Rock,soft rock, 17-Feb- Eagles 1976 00:43:08 32.2 42 9.5 Hits(1971- folk rock 6 1975) Saturday 15-Nov- Bee Gees Night 1977 1:15:54 Disco 20.6 9.0 77 Fever Fleetwood 04-Feb- Rumours 1977 00:40:01 Soft rock 27.9 40 9.5 Mac 首先,我们来先看一看Python中简单的数学操作是怎么来支持我们分析这
于 濵 已经被删除,所以就会出错。这里我们看到,执行的结果是表示名字 濵 并未 被定义。 二、数学操作与变量 下面就让我们通过一个样例数据集来开始学习 P瀌瀇濻瀂瀁 语言。这个样例数据 集是从网上下载的有关电影原声碟的一些数据信息。通过对这个数据集的内容进 行研究,就可以回答一些像哪个风格的专辑卖得销量最好,或者是谁的专辑的评 分最高的问题。这个数据集包含了若干列,包括艺术家的名字、专辑的名字、发 行年代、长度、音乐的类型等等。通过对这个数据集进行处理就可以得到我们想 要的一些结果。 首先,我们来先看一看 P瀌瀇濻瀂瀁 中简单的数学操作是怎么来支持我们分析这
个数据集的。假设现有三盘音乐大碟,它们的时间分别是43分钟,1小时16分 钟和41分钟,我们想知道在两个小时之内有没有可能听完这三个专辑。现在, 我们要使用一些Python中简单的数据操作来回答这个问题。我们可以将这三盘 专辑的时间加起来就得到了总的时长是160分钟,160分钟是多少个小时呢?我 们除以60,发现有两个多小时,也就意味着这三盘专辑的时间总长已经超过了 两个小时,我们没有办法在两个小时内听完这三张专辑的所有内容。这里我们看 到了加法和除法的操作,实际上Python中的简单数学操作包括了我们常见的加 减乘除以及幂的操作,其中幂的操作是由两个乘号来表示的,4*2这个表达式想 表达的含义就是4的平方。 1n151143+60+16+41 0utI5J:160 太梧了1现在你通过远算得到了总时间为10分钟 那么160分钟是几个小时呢 1n16]t150/60 0ut161±2.6666666666666665 我们发现时间超过了2小时,那就意球着你不可能在两个小时内听完三个专辑。 p]Pythoni中的简单数学操作 你可以做如下数学运算 。加法:2+2 。减法·5,身 。票4种2 前面计算的结果可能我们在后续还要继续使用,于是我们可以把中间计算的 结果存储到变量中,后续直接可以使用它。我们定义了一个×的变量,它的值就 是我们刚才计算结果,如果以后在代码中想再次访问x值,直接可以使用它。例 如x值保存的是前面的加法结果160。我们也可以把一些复杂运算的结果放到变 量里,例如,将四个整数相加除以60的结果放到一个变量中。现在totalhour的 值就是刚才我们计算出来的三个专辑内容总长的小时数
个数据集的。假设现有三盘音乐大碟,它们的时间分别是 43 分钟,1 小时 16 分 钟和 41 分钟,我们想知道在两个小时之内有没有可能听完这三个专辑。现在, 我们要使用一些 P瀌瀇濻瀂瀁 中简单的数据操作来回答这个问题。我们可以将这三盘 专辑的时间加起来就得到了总的时长是 160 分钟,160 分钟是多少个小时呢?我 们除以 60,发现有两个多小时,也就意味着这三盘专辑的时间总长已经超过了 两个小时,我们没有办法在两个小时内听完这三张专辑的所有内容。这里我们看 到了加法和除法的操作,实际上 P瀌瀇濻瀂瀁 中的简单数学操作包括了我们常见的加 减乘除以及幂的操作,其中幂的操作是由两个乘号来表示的,4**2 这个表达式想 表达的含义就是 4 的平方。 前面计算的结果可能我们在后续还要继续使用,于是我们可以把中间计算的 结果存储到变量中,后续直接可以使用它。我们定义了一个 瀋 的变量,它的值就 是我们刚才计算结果,如果以后在代码中想再次访问 瀋 值,直接可以使用它。例 如 瀋 值保存的是前面的加法结果 160。我们也可以把一些复杂运算的结果放到变 量里,例如,将四个整数相加除以 60 的结果放到一个变量中。现在 瀇瀂瀇濴濿濻瀂瀈瀅 的 值就是刚才我们计算出来的三个专辑内容总长的小时数
我们还可以把结果存储到变量中,这样我们就可以在之后继续使用。比如: n171:x=43+60+16+41 如果想要再次使用x的值,我们可以执行这个变量 In []:x 0utf0]:160 你可以把一些运算的结果放入安量 In 19]:total hr-(43 60 16+41)60 get total hours in a Bingie expreasion total hr 0ut191:2.5566666666555665 在前面的代码中我们都看到了一些由#开头的语句。这些语句就是所谓的注 释。Python语言中注释是由#开头的,它们不会在代码中被解释执行,也就是说, 它们不会被当作代码去执行,它们的作用是给人看的,是用来说明这段代码想要 做什么。 我们可以看到Python的变量可以来存储计算的结果,以便在后续计算中继 续去使用它,对变量我们还可以通过赋值操作去改变它的内容。 三、数据类型和逻辑操作 Python提供了五种标准的数据类型,包括 ● 数值Numbers(整型int,长整型Iong,浮点数float,复数complex) ● 字符串String(字符的连续集合) ● 列表List 元组Tuple ● 字典Dictionary 前面我们看到的是处理数值型数据的例子。Python还可以处理字符串,例如, 下面定义了一个字符串类型的变量。所谓字符串就是用单引号或者双引号括住的 一个字符序列。 Pyh并非只能处理各类数字,它还可以处理字符串,字符串的例子如下: Python中用一对双引号")或者单引号"活住的就是字符串
在前面的代码中我们都看到了一些由#开头的语句。这些语句就是所谓的注 释。P瀌瀇濻瀂瀁 语言中注释是由#开头的,它们不会在代码中被解释执行,也就是说, 它们不会被当作代码去执行,它们的作用是给人看的,是用来说明这段代码想要 做什么。 我们可以看到 P瀌瀇濻瀂瀁 的变量可以来存储计算的结果,以便在后续计算中继 续去使用它,对变量我们还可以通过赋值操作去改变它的内容。 三、数据类型和逻辑操作 P瀌瀇濻瀂瀁 提供了五种标准的数据类型,包括 l 数值 N瀈瀀濵濸瀅瀆 (整型 濼瀁瀇,长整型 濿瀂瀁濺,浮点数 濹濿瀂濴瀇,复数 濶瀂瀀瀃濿濸瀋) l 字符串 S瀇瀅濼瀁濺 (字符的连续集合) l 列表 L濼瀆瀇 l 元组 T瀈瀃濿濸 l 字典 D濼濶瀇濼瀂瀁濴瀅瀌 前面我们看到的是处理数值型数据的例子。P瀌瀇濻瀂瀁 还可以处理字符串,例如, 下面定义了一个字符串类型的变量。所谓字符串就是用单引号或者双引号括住的 一个字符序列