Python的pandas 怎么知道一个index，找这个index是第几个？

2024-05-12 06:42

1. Python的pandas 怎么知道一个index，找这个index是第几个？

# 没太明白你的意思,是不是根据值查询值的索引import numpy as npimport pandas as pds = pd.Series(np.random.randint(0,10,10))print(s.values)# >>> array([3, 5, 1, 0, 8, 2, 9, 0, 5, 3])# 比如要找value 为 5 的索引v_5 = s[s==5]print(v_5.index)# >>> Int64Index([1, 8], dtype='int64')

2. python pandas修改某一列

f = lambda x: x.replace("(", "").replace(")", "")df['browse_nodes'] = df['browse_nodes'].map(f)

3. 如何将pandas.dataframe的数据读取到文件中

首先是引入pandas和numpy，这是经常配合使用的两个包，pandas依赖于numpy，引入以后我们可以直接使用np/pd来表示这个两个模块
先创建一个时间索引，所谓的索引（index)就是每一行数据的id，可以标识每一行的唯一值
为了快速入门，我们看一下如何创建一个6X4的数据：randn函数用于创建随机数，参数表示行数和列数，dates是上一步创建的索引列
我们还可以使用字典来创建数据框，例如创建一个列名为A的数据框，索引是自动创建的整数
这又是一个字典创建DataFrame的例子
假如字典内的数据长度不同，以最长的数据为准，比如B列有4行：
可以使用dtypes来查看各行的数据格式
接着看一下如何查看数据框中的数据，看一下所有的数据
使用head查看前几行数据（默认是前5行），不过你可以指定前几行
查看前三行数据
使用tail查看后5行数据
查看数据框的索引
查看列名用columns
查看数据值，用values
查看描述性统计，用describe
使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据
使用T来转置数据，也就是行列转换
对数据进行排序，用到了sort，参数可以指定根据哪一列数据进行排序

如何将pandas.dataframe的数据读取到文件中

4. 弱问DataFrame怎么指定某列为索引

弱问DataFrame怎么指定某列为索引
list.index(value)

python 自带方法

5. python怎么把某行设为索引

主键是表中的一个或多个字段，它的值用于惟一地标识表中的某一条记录.且不能为空；
索引是对数据库表中一列或多列的值进行排序的一种结构，只有当经常查询索引列中的数据时，才需要在表上创建索引，使用索引可快速访问数据库表中的特定信息。
索引占用磁盘空间，并且降低添加、删除和更新行的速度。当然索引也有好处就是查询速度快，它利还是大于弊的所以请慎重使用索引。

python怎么把某行设为索引

6. python中iloc 和loc ix的区别

loc 在index的标签上进行索引,范围包括start和end。
iloc 在index的位置上进行索引,不包括end.。
ix 是 iloc 和 loc的合体。
Python(英语发音:/ˈpaɪθən/), 是一种面向对象、解释型计算机程序设计语言，由Guido van Rossum于1989年底发明，第一个公开发行版发行于1991年，Python 源代码同样遵循 GPL(GNU General Public License)协议。Python语法简洁而清晰，具有丰富和强大的类库。它常被昵称为胶水语言，能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是，使用Python快速生成程序的原型(有时甚至是程序的最终界面)，然后对其中有特别要求的部分，用更合适的语言改写，比如3D游戏中的图形渲染模块，性能要求特别高，就可以用C/C++重写，而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题，某些可能不提供跨平台的实现。

7. python中pandas.read_table()报错

在最后加上engine='python'就可以了，即
users = pd.read_table('users.dat', sep='::',header = None, names = unames , engine = 'python')

python中pandas.read_table()报错

8. 请问在Pandas用read_excel函数读取数据

利用Python的pandas数据结构来读取excel表格的数据，部分代码如下：
#-*- coding:utf-8 -*-
import pandas as pd
import matplotlib.pyplot as plt
catering_data="catering_sale.xls"
data=pd.read_excel(catering_data,index_col=u'日期')
#读取数据，指定"日期"列为索引列；
大多数书上都是这样写的，但是在Python2.7上运行时出现错误。（没有在Python3.x版本试过）
出现了如下问题：
这里写图片描述
使用help（pd.read_excel）发现参数中有必选参数sheetname,加入到函数中，代码如下：
#-*- coding:utf-8 -*-
import pandas as pd
import matplotlib.pyplot as plt
catering_data="catering_sale.xls"
data=pd.read_excel(catering_data,sheetname=0,index_col=u'日期')
运行成功。
sheetname=0 的意思是：读取xls文件中的第一个表格。（假设文件中有很多个表格）
另外，也可以将文件转换成csv格式，就不需要这个参数了。代码如下：
catering_data="catering_sale.csv"
data=pd.read_csv(catering_data)
1、读取txt数据
In [1]: import pandas as pd
In [2]: mydata_txt = pd.read_csv('C:\\test_code.txt',sep = '\t',encoding = 'utf-8')
对于中文的文本文件常容易因为编码的问题而读取失败，正如上图所示。遇到这样的编码问题该如何处置呢？解决办法有两种情况：
1）当原始文件txt或csv的数据不是uft8格式时，需要另存为utf8格式编码；
2）如果原始的数据文件就是uft8格式，为了正常读入，需要将read_csv函数的参数encoding设置为utf-8
将原始数据另存为utf8格式的数据，重新读入txt数据
In [3]: mydata_txt = pd.read_csv('C:\\test.txt',sep = '\t',encoding = 'utf-8')
In [4]: mydata_txt
很顺利，txt文本文件数据就这样进入了Python的口袋里了。
2、读取csv数据
csv文本文件是非常常用的一种数据存储格式，而且其存储量要比Excel电子表格大很多，下面我们就来看看如何利用Python读取csv格式的数据文件：
In [5]: mydata_csv = pd.read_csv('C:\\test.csv',sep = ',',encoding = 'utf-8')
In [6]: mydata_csv
如果你善于总结的话，你会发现，txt文件和csv文件均可以通过pandas模块中的read_csv函数进行读取。该函数有20多个参数，类似于R中的read.table函数，如果需要查看具体的参数详情，可以查看帮助文档：help(pandas.read_csv)