找到关于 Pandas 的507 篇文章
278 次浏览
假设你有一个数据框,移除唯一前缀城市名称的结果是: Id City 2 3 Kolkata 3 4 Hyderabad 6 7 Haryana 8 9 Kakinada 9 10 Kochin 要解决这个问题,我们将遵循以下步骤 -解决方案 定义一个数据框 创建一个空列表,首先将所有城市列的值的第一个字符附加到列表中,l = [] for x in df['City']: l.append(x[0]) 创建另一个空列表来过滤重复的字符。设置 for 循环和 if 条件来附加唯一的字符。定义如下,l1 = [] for j in l: if(l.count(j)>1): if(j not in ... 阅读更多
3K+ 次浏览
将摄氏度转换为华氏度的结果如下: Id 摄氏度 华氏度 0 1 37.5 99.5 1 2 36.0 96.8 2 3 40.0 104.0 3 4 38.5 101.3 4 5 39.0 102.2 要解决这个问题,我们将遵循以下方法 -解决方案 1 定义一个带有 'Id' 和 'Celsius' 列值的数据框 应用 df.assign 函数在编写 lambda 函数内将摄氏度值乘以 (9/5)*df[celsius]+32 并将其赋值给华氏度。定义如下 -df.assign(Fahrenheit = lambda x: (9/5)*x['Celsius']+32) 示例 让我们检查以下代码以更好地理解 -import pandas as pd df = pd.DataFrame({'Id':[1, 2, 3, 4, 5], ... 阅读更多
765 次浏览
将 1 到 100 的魔术数字附加的结果如下: 魔术数字序列: 0 1 1 10 2 19 3 28 4 37 5 46 6 55 7 64 8 73 9 82 10 91 11 100 要解决这个问题,我们将遵循以下方法 -解决方案 1 创建列表推导式,将 1 到 100 的值附加到列表 ls 中。ls = [i for i in range(1, 101)] 应用 ... 阅读更多
556 次浏览
打印回文名称的结果如下 -回文名称是: Id Name 0 1 bob 2 3 hannah 要解决这个问题,我们将遵循以下方法 -解决方案 1 定义一个数据框 在设置 for 循环内创建列表推导式,使用 i 变量访问 df[‘Name’] 列的所有值,并设置 if 条件来比较 i==i[::-1],然后将 i 值添加到列表 l 中。l = [ i for i in df['Name'] if(i==i[::-1])] 最后,使用 isin() 检查 df[‘Name’] 列中是否存在列表值。df[df['Name'].isin(l)] 示例 让我们检查以下代码以更好地理解 -import pandas as pd data = ... 阅读更多
223 次浏览
假设你有一个时间序列,本地化亚洲时区的结果如下: 索引是: DatetimeIndex(['2020-01-05 00:30:00+05:30', '2020-01-12 00:30:00+05:30', '2020-01-19 00:30:00+05:30', '2020-01-26 00:30:00+05:30', '2020-02-02 00:30:00+05:30'], dtype='datetime64[ns, Asia/Calcutta]', freq='W-SUN') 解决方案 定义一个数据框 使用 pd.date_range() 函数创建时间序列,起始时间为 '2020-01-01 00:30',周期为 5,tz = 'Asia/Calcutta',然后将其存储为 time_index。time_index = pd.date_range('2020-01-01 00:30', periods = 5, freq ='W', tz = 'Asia/Calcutta') 将 df.index 设置为从 time_index 存储本地化时区。df.index = time_index 最后打印本地化时区。示例 让我们检查 ... 阅读更多
10K+ 次浏览
假设你在数据框中有一个 datetime 列,分离日期和时间的結果如下: datetime date time 0 2020-01-01 07:00:00 2020-01-06 07:00:00 1 2020-01-02 07:00:00 2020-01-06 07:00:00 2 2020-01-03 07:00:00 2020-01-06 07:00:00 3 2020-01-04 07:00:00 2020-01-06 07:00:00 4 2020-01-05 07:00:00 2020-01-06 07:00:00 5 2020-01-06 07:00:00 2020-01-06 07:00:00 要解决这个问题,我们将遵循以下方法 -解决方案 1 使用 pd.date_range() 定义一个数据框的 'datetime' 列。定义如下,pd.DataFrame({'datetime':pd.date_range('2020-01-01 07:00', periods=6)}) 设置 for 循环 d 变量,依次访问 df[‘datetime’] 列。从 for 循环转换日期和时间,并将其保存为 df[‘date’] ... 阅读更多
92 次浏览
假设你有一个序列,排序的唯一值的数字索引如下 -排序的唯一值 - 数字索引数组 [2 3 0 3 2 1 4] ['apple' 'kiwi' 'mango' 'orange' 'pomegranate'] 要解决这个问题,我们将遵循以下步骤 -解决方案 应用 pd.factorize() 函数到非唯一元素的列表中,并将其保存为索引,index_value。index, unique_value = pd.factorize(['mango', 'orange', 'apple', 'orange', 'mango', 'kiwi', 'pomegranate']) 打印索引和元素。结果显示没有排序的唯一值及其索引。在列表元素中应用 pd.factorize() 并设置 sort=True,然后将其保存为 sorted_index,unique_valuesorted_index, unique_value = pd.factorize(['mango', 'orange', 'apple', 'orange', 'mango', ... 阅读更多
159 次浏览
假设你有一个数据框,大小为 3 的滚动窗口计算结果如下: 滚动窗口的平均值是: Id 年龄 分数 0 NaN NaN NaN 1 1.5 12.0 85.0 2 2.5 13.0 80.0 3 3.5 13.5 82.5 4 4.5 31.5 90.0 5 5.5 60.0 87.5 要解决这个问题,我们将遵循以下方法 -解决方案 定义一个数据框 应用 df.rolling(window=2).mean() 来计算大小为 3 的滚动窗口的平均值。df.rolling(window=2).mean() 示例 让我们检查以下代码以更好地理解 -import pandas as pd df = pd.DataFrame({"Id":[1, 2, 3, 4, 5, 6], ... 阅读更多
94 次浏览
假设你有一个序列,从序列中每个元素切片子字符串的结果如下: 0 Ap 1 Oa 2 Mn 3 Kw 要解决这个问题,我们将遵循以下方法 -解决方案 1 定义一个序列 应用 str.slice 函数,起始位置为 0,停止位置为 4,步长为 2,从序列中切片子字符串。data.str.slice(start=0, stop=4, step=2) 示例 让我们检查以下代码以更好地理解 -import pandas as pd data = pd.Series(['Apple', 'Orange', 'Mango', 'Kiwis']) print(data.str.slice(start=0, stop=4, step=2)) 输出 0 Ap 1 Oa 2 Mn 3 Kw 解决方案 2 定义一个序列 应用字符串索引切片,从 0 开始 ... 阅读更多
624 次浏览
使用 ‘’ 分隔符分割字符串并转换为序列的结果如下: 0 apple 1 orange 2 mango 3 kiwi 要解决这个问题,我们将遵循以下方法 -解决方案 1 定义一个函数 split_str(),它接受两个参数:字符串和分隔符。在分隔符值内创建 s.split() 函数,并将其存储为 split_data。split_data = s.split(d) 应用 pd.Series() 内的 split_data 来生成序列数据。pd.Series(split_data) 最后,调用函数以返回结果。示例 让我们检查以下代码以更好地理解 -import pandas as pd def split_str(s, d): split_data = s.split(d) print(pd.Series(split_data)) split_str('apple\torange\tmango\tkiwi', '\t') 输出 0 apple 1 ... 阅读更多