首页 >科技 > 内容

🎉 pandas数据合并之一文弄懂pd.concat() 📊

科技 2025-03-30 00:36:01
导读 在数据分析中,`pd.concat()` 是 pandas 库中最常用的函数之一,用于将多个 DataFrame 或 Series 合并为一个。它简单高效,但若使用...

在数据分析中,`pd.concat()` 是 pandas 库中最常用的函数之一,用于将多个 DataFrame 或 Series 合并为一个。它简单高效,但若使用不当,可能导致结果不如预期。本文带你彻底搞懂 `pd.concat()` 的用法和注意事项!

首先,`pd.concat()` 支持按行(`axis=0`)或按列(`axis=1`)合并数据。例如:

```python

import pandas as pd

df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})

df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})

result = pd.concat([df1, df2]) 默认 axis=0,纵向合并

print(result)

```

此时,`pd.concat()` 会将两个 DataFrame 按索引对齐后合并。若希望保留原索引,可设置参数 `ignore_index=True`。

其次,注意键值对齐问题。如果 DataFrame 的列名不同,合并时可能会出现缺失值(NaN)。例如:

```python

df3 = pd.DataFrame({'C': [9, 10]})

result = pd.concat([df1, df3], axis=1) 横向合并

print(result)

```

此时,`df3` 的列名 `C` 不在 `df1` 中,因此右侧会出现 NaN 值。

最后,别忘了检查合并后的数据是否符合预期!掌握这些技巧后,你就能轻松驾驭 `pd.concat()`,让数据处理事半功倍!✨

免责声明:本文由用户上传,如有侵权请联系删除!