4.1 Pandas中的数据结构1.Series的创建【例4-2】创建Series时指定索引In[2]:i= ["a","c","d","a"]V = [2, 4, 5, 7]t = pd.Series(v, index = i, name = "col")print(t)2aOut[2]:4c5d7aName:col, dtype:int64尽管创建Series指定了index参数,实际Pandas还是有隐藏的index位置信息的。所以Series有两套描述某条数据的手段:位置和标签
1. Series的创建 【例4-2】创建Series时指定索引 In[2]: i = ["a", "c", "d", "a"] v = [2, 4, 5, 7] t = pd.Series(v, index = i, name = "col") print(t) Out[2]: a 2 c 4 d 5 a 7 Name: col, dtype: int64 尽管创建Series指定了index参数,实际Pandas还是有隐藏的index位置信息的。所以 Series有两套描述某条数据的手段:位置和标签 4.1 Pandas中的数据结构
4.1 Pandas中的数据结构1. Series的创建【例4-3】Series位置和标签的使用In[3]:val =[2, 4, 5, 6]-idx1 = range(10, 14),idx2 ="hello the cruel world".splitO.sO = pd.Series(val)Out[3]:Rangelndex(start =0, stop=4, step =1),sl = pd.Series(val, index = idxl),RangeIndex(start=10, stop=14, step=1)t= pd.Series(val, index = idx2),Index(["hello', 'the', 'cruel','world'], dtype ='object)print(so.index),2uprint(s1.index).2uprint(t. index)default: 2 label: 2,print(s0[0])-print(s1[10])print('default:,t[o],label:',t["hello"D
1. Series的创建 【例4-3】Series位置和标签的使用 4.1 Pandas中的数据结构
4.1 Pandas中的数据结构1. Series的创建2)通过字典创建如果数据被存放在一个Python字典中,也可以直接通过这个字典来创建Series。In[4]:sdata = {Ohio': 35000, "Texas': 71000, Oregon': 16000,'Utah':5000)obj3 = pd.Series(sdata)print(obj3)Out[4]:35000OhioTexas7100016000OregonUtah5000dtype: int64
1. Series的创建 2)通过字典创建 如果数据被存放在一个Python字典中,也可以直接通过这个字典来 创建Series。 In[4]: sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000} obj3 = pd.Series(sdata) print(obj3) Out[4]: Ohio 35000 Texas 71000 Oregon 16000 Utah 5000 dtype: int64 4.1 Pandas中的数据结构
4.1 Pandas中的数据结构1. Series的创建2)通过字典创建【例4-6】键值和指定的索引不匹配In[6]:sdata ={"a":100,"b":200,"e":300]letter=["a","b","c","e"]obj = pd.Series(sdata, index = letter)print(obj)Out[6]:100.0ab200.0NaNc300.0edtype: float64
【例4-6】键值和指定的索引不匹配 In[6]: sdata = {"a" : 100, "b" : 200, "e" : 300} letter = ["a", "b","c" , "e" ] obj = pd.Series(sdata, index = letter) print(obj) Out[6]: a 100.0 b 200.0 c NaN e 300.0 dtype: float64 1. Series的创建 2)通过字典创建 4.1 Pandas中的数据结构
4.1 Pandas中的数据结构1.Series的创建2)通过字典创建【例4-7】不同索引数据的自动对齐In[7]:sdata = {'Ohio': 35000,'Texas': 71000,'Oregon': 16000,Utah': 5000)obj1=pd.Series(sdata)states=['California','Ohio','Oregon','Texas']obj2=pd.Series(sdata, index=states)print(obj1+obj2)Out[7]:NaNCaliforniaOhio70000.0Oregon32000.0Texas142000.0UtahNaNdtype:float64
1. Series的创建 2)通过字典创建 【例4-7】不同索引数据的自动对齐 In[7]: sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000} obj1 = pd.Series(sdata) states = ['California', 'Ohio', 'Oregon', 'Texas'] obj2 = pd.Series(sdata, index = states) print(obj1+obj2) Out[7]: California NaN Ohio 70000.0 Oregon 32000.0 Texas 142000.0 Utah NaN dtype: float64 4.1 Pandas中的数据结构