పైథాన్‌లో డేటాఫ్రేమ్‌లను ఎలా విలీనం చేయాలో తెలుసుకోండి

పైథాన్‌లో డేటాఫ్రేమ్‌లను ఎలా విలీనం చేయాలో తెలుసుకోండి

మీరు పైథాన్‌ని ఉపయోగిస్తుంటే, సులభమైన పనుల కోసం కూడా, దాని మూడవ పక్ష లైబ్రరీల ప్రాముఖ్యత గురించి మీకు బహుశా తెలిసి ఉండవచ్చు. డేటాఫ్రేమ్‌లకు అద్భుతమైన మద్దతుతో పాండాస్ లైబ్రరీ అటువంటి లైబ్రరీలలో ఒకటి.





మీరు పైథాన్ డేటాఫ్రేమ్‌లలోకి బహుళ రకాల ఫైల్‌లను దిగుమతి చేసుకోవచ్చు మరియు విభిన్న డేటా సెట్‌లను నిల్వ చేయడానికి వివిధ వెర్షన్‌లను సృష్టించవచ్చు. మీరు DataFramesని ఉపయోగించి మీ డేటాను దిగుమతి చేసుకున్న తర్వాత, మీరు వాటిని వివరణాత్మక విశ్లేషణ చేయడానికి విలీనం చేయవచ్చు.





బేసిక్స్‌ను పరిష్కరించడం

మీరు విలీనం చేయడాన్ని ప్రారంభించడానికి ముందు, మీరు విలీనం చేయడానికి డేటాఫ్రేమ్‌లను కలిగి ఉండాలి. అభివృద్ధి ప్రయోజనాల కోసం, మీరు ప్రయోగం చేయడానికి కొంత నకిలీ డేటాను సృష్టించవచ్చు.





పైథాన్‌లో డేటాఫ్రేమ్‌లను సృష్టించండి

మొదటి దశగా, పాండాస్ లైబ్రరీని మీ పైథాన్ ఫైల్‌లోకి దిగుమతి చేయండి. Pandas అనేది పైథాన్‌లో డేటాఫ్రేమ్‌లను నిర్వహించే థర్డ్-పార్టీ లైబ్రరీ. మీరు ఉపయోగించవచ్చు దిగుమతి కింది విధంగా లైబ్రరీని ఉపయోగించడానికి ప్రకటన:

import pandas as pd

మీరు మీ కోడ్ సూచనలను తగ్గించడానికి లైబ్రరీ పేరుకు మారుపేరును కేటాయించవచ్చు.



మీరు నిఘంటువులను సృష్టించాలి, వీటిని మీరు డేటాఫ్రేమ్‌లుగా మార్చవచ్చు. ఉత్తమ ఫలితాల కోసం, రెండు నిఘంటువు వేరియబుల్‌లను సృష్టించండి- డిక్ట్1 మరియు డిక్ట్2- నిర్దిష్ట సమాచారాన్ని నిల్వ చేయడానికి:

dict1 = {"user_id": ["001", "002", "003", "004", "005"], 
"FName": ["John", "Brad", "Ron", "Roald", "Chris"],
"LName": ["Harley", "Cohen", "Dahl", "Harrington", "Kerr-Hislop"]}

dict2 = {"user_id": ["001", "002", "003", "004"], "Age": [15, 28, 34, 24]}

గుర్తుంచుకోండి, మీ డేటాఫ్రేమ్‌లను తర్వాత కలపడానికి ప్రాథమిక కీగా పని చేయడానికి, మీరు రెండు నిఘంటువు విలువలలో ఒక సాధారణ మూలకాన్ని కలిగి ఉండాలని గుర్తుంచుకోండి.





మీ నిఘంటువులను డేటాఫ్రేమ్‌లుగా మార్చండి

మీ నిఘంటువు విలువలను డేటాఫ్రేమ్‌లుగా మార్చడానికి, మీరు ఈ క్రింది పద్ధతిని ఉపయోగించవచ్చు:

df1 = pd.DataFrame(dict1) 
df2 = pd.DataFrame(dict2)

కొన్ని IDEలు డేటాఫ్రేమ్ ఫంక్షన్‌ను సూచించడం మరియు నొక్కడం ద్వారా డేటాఫ్రేమ్‌లోని విలువలను తనిఖీ చేయడానికి మిమ్మల్ని అనుమతిస్తాయి. రన్/ఎగ్జిక్యూట్ . అక్కడ చాలా ఉన్నాయి పైథాన్-అనుకూల IDEలు , కాబట్టి మీరు నేర్చుకునేందుకు సులభమైన దాన్ని మీరు ఎంచుకొని ఎంచుకోవచ్చు.





imessage ద్వారా ఆటలను ఎలా ఆడాలి
  జూపిటర్ నోట్‌బుక్ కోడ్ స్నిప్పెట్

మీ డేటాఫ్రేమ్‌ల కంటెంట్‌లతో మీరు సంతృప్తి చెందిన తర్వాత, మీరు విలీన దశకు వెళ్లవచ్చు.

విలీనం ఫంక్షన్‌తో ఫ్రేమ్‌లను కలపడం

విలీనం ఫంక్షన్ అనేది మీరు రెండు డేటాఫ్రేమ్‌లను కలపడానికి ఉపయోగించే మొదటి పైథాన్ ఫంక్షన్. ఈ ఫంక్షన్ కింది డిఫాల్ట్ ఆర్గ్యుమెంట్‌లను తీసుకుంటుంది:

pd.merge(DataFrame1, DataFrame2, how= type of merge)

ఎక్కడ:

  • pd పాండాస్ లైబ్రరీకి మారుపేరు.
  • విలీనం డేటాఫ్రేమ్‌లను విలీనం చేసే ఫంక్షన్.
  • డేటా ఫ్రేమ్1 మరియు డేటాఫ్రేమ్2 విలీనం చేయవలసిన రెండు డేటాఫ్రేమ్‌లు.
  • ఎలా విలీనం రకాన్ని నిర్వచిస్తుంది.

కొన్ని అదనపు ఐచ్ఛిక ఆర్గ్యుమెంట్‌లు అందుబాటులో ఉన్నాయి, మీరు సంక్లిష్ట డేటా నిర్మాణాన్ని కలిగి ఉన్నప్పుడు వీటిని ఉపయోగించవచ్చు.

విలీన రకాన్ని ఎలా నిర్వచించాలో పరామితి కోసం మీరు వేర్వేరు విలువలను ఉపయోగించవచ్చు. ఈ రకమైన విలీనం మీకు తెలిసి ఉంటుంది డేటాబేస్ పట్టికలలో చేరడానికి SQLని ఉపయోగించారు .

టీ షర్టులు కొనడానికి ఉత్తమ ప్రదేశం

ఎడమ విలీనం

ఎడమ విలీన రకం మొదటి డేటాఫ్రేమ్ విలువలను అలాగే ఉంచుతుంది మరియు రెండవ డేటాఫ్రేమ్ నుండి సరిపోలే విలువలను లాగుతుంది.

  జూపిటర్ నోట్‌బుక్ కోడ్ స్నిప్పెట్

కుడి విలీనం

సరైన విలీన రకం రెండవ DataFrame విలువలను అలాగే ఉంచుతుంది మరియు మొదటి DataFrame నుండి సరిపోలే విలువలను లాగుతుంది.

  జూపిటర్ నోట్‌బుక్ కోడ్ స్నిప్పెట్

అంతర్గత విలీనం

అంతర్గత విలీన రకం రెండు డేటాఫ్రేమ్‌ల నుండి సరిపోలే విలువలను అలాగే ఉంచుతుంది మరియు సరిపోలని విలువలను తీసివేస్తుంది.

  జూపిటర్ నోట్‌బుక్ కోడ్ స్నిప్పెట్

బాహ్య విలీనం

బాహ్య విలీన రకం అన్ని సరిపోలే మరియు సరిపోలని విలువలను కలిగి ఉంటుంది మరియు డేటాఫ్రేమ్‌లను ఏకీకృతం చేస్తుంది.

  జూపిటర్ నోట్‌బుక్ కోడ్ స్నిప్పెట్

Concat ఫంక్షన్‌ను ఎలా ఉపయోగించాలి

ది కలుస్తుంది పైథాన్ యొక్క కొన్ని ఇతర విలీన ఫంక్షన్‌లతో పోలిస్తే ఫంక్షన్ అనువైన ఎంపిక. కాన్‌కాట్ ఫంక్షన్‌తో, మీరు డేటాఫ్రేమ్‌లను నిలువుగా మరియు అడ్డంగా కలపవచ్చు.

అయితే, ఈ ఫంక్షన్‌ను ఉపయోగించడంలో ఉన్న లోపం ఏమిటంటే, ఇది డిఫాల్ట్‌గా సరిపోలని విలువలను విస్మరిస్తుంది. కొన్ని ఇతర సంబంధిత ఫంక్షన్‌ల మాదిరిగానే, ఈ ఫంక్షన్‌కు కొన్ని ఆర్గ్యుమెంట్‌లు ఉన్నాయి, వీటిలో కొన్ని మాత్రమే విజయవంతమైన కలయికకు అవసరం.

concat(dataframes, axis=0, join='outer'/inner)

ఎక్కడ:

  • కలుస్తుంది డేటాఫ్రేమ్స్‌లో చేరే ఫంక్షన్.
  • డేటాఫ్రేమ్‌లు సంగ్రహించడానికి డేటాఫ్రేమ్‌ల క్రమం.
  • అక్షం సంయోగం యొక్క దిశను సూచిస్తుంది, 0 సమాంతరంగా ఉంటుంది, 1 నిలువుగా ఉంటుంది.
  • చేరండి బాహ్య లేదా లోపలి చేరికను నిర్దేశిస్తుంది.

పై రెండు డేటాఫ్రేమ్‌లను ఉపయోగించి, మీరు ఈ క్రింది విధంగా కాన్‌కాట్ ఫంక్షన్‌ని ప్రయత్నించవచ్చు:

# define the dataframes in a list format 
df_merged_concat = pd.concat([df1, df2])

# print the results of the Concat function
print(df_merged_concat)

పై కోడ్‌లో అక్షం మరియు జాయిన్ ఆర్గ్యుమెంట్‌లు లేకపోవడం రెండు డేటాసెట్‌లను మిళితం చేస్తుంది. ఫలిత అవుట్‌పుట్‌లో మ్యాచ్ స్థితితో సంబంధం లేకుండా అన్ని ఎంట్రీలు ఉంటాయి.

పని చేయని Mac ని క్లిక్ చేసి లాగండి

అదేవిధంగా, మీరు concat ఫంక్షన్ యొక్క దిశ మరియు అవుట్‌పుట్‌ను నియంత్రించడానికి అదనపు ఆర్గ్యుమెంట్‌లను ఉపయోగించవచ్చు.

సరిపోలే అన్ని ఎంట్రీలతో అవుట్‌పుట్‌ని నియంత్రించడానికి:

# Concatenating all matching values between the two dataframes based on their columns 
df_merged_concat = pd.concat([df1, df2], axis=1, join = 'inner')

print(df_merged_concat)

ఫలితం రెండు డేటాఫ్రేమ్‌ల మధ్య సరిపోలే అన్ని విలువలను మాత్రమే కలిగి ఉంటుంది.

  జూపిటర్ నోట్‌బుక్ కోడ్ స్నిప్పెట్

పైథాన్‌తో డేటాఫ్రేమ్‌లను విలీనం చేయడం

డేటాఫ్రేమ్‌లు వాటి వశ్యత మరియు కార్యాచరణను పరిగణనలోకి తీసుకుని పైథాన్‌లో అంతర్భాగం. వారి బహుముఖ ఉపయోగాల దృష్ట్యా, మీరు చాలా సులభంగా వివిధ రకాల పనులను నిర్వహించడానికి వాటిని విస్తృతంగా ఉపయోగించవచ్చు.

మీరు ఇప్పటికీ Python DataFrames గురించి నేర్చుకుంటున్నట్లయితే, కొన్ని Excel ఫైల్‌లను దిగుమతి చేసుకోవడానికి ప్రయత్నించండి, ఆపై వాటిని విభిన్న విధానాలతో కలపండి.