_Pandas_提供了一组字符串函数,可以方便地对字符串数据进行操作。 最重要的是,这些函数忽略(或排除)丢失/NaN值。 几乎这些方法都使用Python字符串函数(请参阅: http://docs.python.org/3/library/stdtypes.html#string-methods )。 因此,将Series对象转换为String对象,然后执行该操作。 下面来看看每个操作的执行和说明。

编号

函数

描述

1

lower()

Series/Index中的字符串转换为小写。

2

upper()

Series/Index中的字符串转换为大写。

3

len()

计算字符串长度。

4

strip()

帮助从两侧的系列/索引中的每个字符串中删除空格(包括换行符)。

5

split(' ')

用给定的模式拆分每个字符串。

6

cat(sep=' ')

使用给定的分隔符连接系列/索引元素。

7

get_dummies()

返回具有单热编码值的数据帧(DataFrame)。

8

contains(pattern)

如果元素中包含子字符串,则返回每个元素的布尔值True,否则为False

9

replace(a,b)

将值a替换为值b

10

repeat(value)

重复每个元素指定的次数。

11

count(pattern)

返回模式中每个元素的出现总数。

12

startswith(pattern)

如果系列/索引中的元素以模式开始,则返回true

13

endswith(pattern)

如果系列/索引中的元素以模式结束,则返回true

14

find(pattern)

返回模式第一次出现的位置。

15

findall(pattern)

返回模式的所有出现的列表。

16

swapcase

变换字母大小写。

17

islower()

检查系列/索引中每个字符串中的所有字符是否小写,返回布尔值

18

isupper()

检查系列/索引中每个字符串中的所有字符是否大写,返回布尔值

19

isnumeric()

检查系列/索引中每个字符串中的所有字符是否为数字,返回布尔值。

代码举例:

import pandas as pd
import numpy as np

s = pd.Series([‘Tom’, ‘William Rick’, ‘John’, ‘Alber@t’, np.nan, ‘1234’, ‘SteveMinsu’])
print(s.str.lower())
print(s.str.upper())
print(s.str.len())
print(s.str.strip())
print(s.str.split(’ ‘))
print(s.str.cat(sep=’ <=> ‘))
print(s.str.get_dummies())
print(s.str.contains(’ ‘))
print(s.str.replace(’@', ‘$’))
print(s.str.repeat(2))
print(s.str.count(‘m’))
print(s.str.startswith(‘T’))
print(s.str.endswith(‘t’))
print(s.str.find(‘e’))
print(s.str.findall(‘e’))
print(s.str.swapcase())
print(s.str.islower())
print(s.str.isupper())
print(s.str.isnumeric())

代码 Github地址:https://github.com/shadowagnoy/python_learn/