В Pandas есть три основных способа объединить DataFrames, каждый предназначен для своего случая.
pd.merge()Объединение в стиле SQL на основе совпадающих значений в столбцах.
inner, left, right и outerpd.merge(df1, df2, on="user_id", how="left")
df.join()Объединение по индексу, удобно когда у DataFrames общий индекс.
pd.merge()df1.join(df2, how="inner")
pd.concat()Склейка DataFrames вертикально или горизонтально без сопоставления по ключам.
axis=0 чтобы объединить строки (добавить DataFrames с одинаковыми столбцами)axis=1 чтобы объединить столбцы рядом друг с другомpd.concat([df1, df2], axis=0) # объединить строки
pd.concat([df1, df2], axis=1) # объединить столбцы
pd.merge() — объединение по значениям столбцов (максимум контроля)df.join() — объединение по индексу (сокращённая форма для объединения по индексу)pd.concat() — склейка DataFrames без сопоставления ключейВыбирай pd.merge() для объединения по столбцам, df.join() для объединения по индексу и pd.concat() когда просто хочешь склеить DataFrames вместе.
pd.merge() выполняет SQL-подобное объединение на основе общих значений столбцов и поддерживает типы join'ов inner, left, right и outer, что делает его самым гибким вариантом для комбинирования DataFrames по совпадающим значениям столбцов.
Новый — ещё не проверен сообществом
Вы