Python Pandas教程之series 上的转换操作

2022-09-18

前言:

在转换操作中,我们执行各种操作,例如更改系列的数据类型,将系列更改为列表等。为了执行转换操作,我们有各种有助于转换的功能,例如.astype().tolist()

代码#1:

# 使用 astype 转换 series 数据类型的 Python 程序
 
# importing pandas module  
import pandas as pd 
   
# 从 url 读取 csv 文件  
data = pd.read_csv("nba.csv") 
    
# 删除空值列以避免错误
data.dropna(inplace = True) 
   
# 在转换之前存储 dtype
before = data.dtypes 
   
# 使用 astype 转换 dtypes
data["Salary"]= data["Salary"].astype(int) 
data["Number"]= data["Number"].astype(str) 
   
# 转换后存储 dtype
after = data.dtypes 
   
# 打印出来比较
print("BEFORE CONVERSION\n", before, "\n") 
print("AFTER CONVERSION\n", after, "\n") 

输出:

代码 #2:

# Python程序将 series 转换为列表
 
# 导入 pandas 模块  
import pandas as pd  
   
# 导入 regex 模块 
import re 
     
# 制作数据框 
data = pd.read_csv("nba.csv")  
     
# 删除空值以避免错误
data.dropna(inplace = True)  
   
# 操作前存储 dtype
dtype_before = type(data["Salary"]) 
   
# 转换为列表
salary_list = data["Salary"].tolist() 
   
# 操作后存储dtype
dtype_after = type(salary_list) 
   
# 打印数据类型
print("Data type before converting = {}\nData type after converting = {}"
      .format(dtype_before, dtype_after)) 
   
# 显示列表
salary_list 

输出 :

Pandas series 方法:

功能 描述
Series() 可以使用 Series() 构造函数方法创建熊猫系列。此构造方法接受各种输入
combine_first() 方法用于将两个系列合二为一
count() 返回系列中非 NA/null 观测值的数量
size() 返回基础数据中的元素数
name() 方法允许为 Series 对象(即列)命名
is_unique() 如果对象中的值是唯一的,则方法返回布尔值
idxmax() 提取Series中最高值的索引位置的方法
idxmin() 提取系列中最低值的索引位置的方法
sort_values() 在 Series 上调用方法以按升序或降序对值进行排序
sort_index() 在熊猫系列上调用方法以按索引而不是其值对其进行排序
head() 方法用于从系列的开头返回指定数量的行。该方法返回一个全新的系列
tail() 方法用于从 Series 的末尾返回指定数量的行。该方法返回一个全新的系列
le() 用于将 Caller 系列的每个元素与传递的系列进行比较。对于每个小于或等于传递系列中的元素的元素,它返回 True
ne() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个不等于传递系列中的元素的元素返回 True
ge() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为大于或等于传递系列中的元素的每个元素返回 True
eq() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个等于传递系列中的元素的元素返回 True
gt() 用于比较两个系列并为每个元素返回布尔值
lt() 用于比较两个系列并为每个元素返回布尔值
clip() 用于剪裁低于和高于传递的最小和最大值的值
clip_lower() 用于裁剪低于传递的最小值的值
clip_upper() 用于剪裁高于传递的最大值的值
astype() 方法用于更改系列的数据类型
tolist() 方法用于将系列转换为列表
get() 在 Series 上调用方法以从 Series 中提取值。这是传统括号语法的替代语法
unique() Pandas unique() 用于查看特定列中的唯一值
nunique() Pandas nunique() 用于获取唯一值的计数
value_counts() 计算每个唯一值在系列中出现的次数的方法
factorize() 方法通过识别不同的值来帮助获得数组的数字表示
map() 将一个对象的值绑定到另一个对象的方法
between() Pandas between() 方法用于系列检查哪些值位于第一个和第二个参数之间
apply() 调用方法并将 Python 函数作为参数提供给每个 Series 值使用该函数。此方法有助于执行 pandas 或 numpy 中未包含的自定义操作

到此这篇关于Python Pandas教程之series 上的转换操作的文章就介绍到这了,更多相关Python series内容请搜索北冥有鱼以前的文章或继续浏览下面的相关文章希望大家以后多多支持北冥有鱼!