మీరు పైథాన్ని ఉపయోగిస్తుంటే, సులభమైన పనుల కోసం కూడా, దాని మూడవ పక్ష లైబ్రరీల ప్రాముఖ్యత గురించి మీకు బహుశా తెలిసి ఉండవచ్చు. డేటాఫ్రేమ్లకు అద్భుతమైన మద్దతుతో పాండాస్ లైబ్రరీ అటువంటి లైబ్రరీలలో ఒకటి.
మీరు పైథాన్ డేటాఫ్రేమ్లలోకి బహుళ రకాల ఫైల్లను దిగుమతి చేసుకోవచ్చు మరియు విభిన్న డేటా సెట్లను నిల్వ చేయడానికి వివిధ వెర్షన్లను సృష్టించవచ్చు. మీరు DataFramesని ఉపయోగించి మీ డేటాను దిగుమతి చేసుకున్న తర్వాత, మీరు వాటిని వివరణాత్మక విశ్లేషణ చేయడానికి విలీనం చేయవచ్చు.
బేసిక్స్ను పరిష్కరించడం
మీరు విలీనం చేయడాన్ని ప్రారంభించడానికి ముందు, మీరు విలీనం చేయడానికి డేటాఫ్రేమ్లను కలిగి ఉండాలి. అభివృద్ధి ప్రయోజనాల కోసం, మీరు ప్రయోగం చేయడానికి కొంత నకిలీ డేటాను సృష్టించవచ్చు.
పైథాన్లో డేటాఫ్రేమ్లను సృష్టించండి
మొదటి దశగా, పాండాస్ లైబ్రరీని మీ పైథాన్ ఫైల్లోకి దిగుమతి చేయండి. Pandas అనేది పైథాన్లో డేటాఫ్రేమ్లను నిర్వహించే థర్డ్-పార్టీ లైబ్రరీ. మీరు ఉపయోగించవచ్చు దిగుమతి కింది విధంగా లైబ్రరీని ఉపయోగించడానికి ప్రకటన:
import pandas as pd
మీరు మీ కోడ్ సూచనలను తగ్గించడానికి లైబ్రరీ పేరుకు మారుపేరును కేటాయించవచ్చు.
మీరు నిఘంటువులను సృష్టించాలి, వీటిని మీరు డేటాఫ్రేమ్లుగా మార్చవచ్చు. ఉత్తమ ఫలితాల కోసం, రెండు నిఘంటువు వేరియబుల్లను సృష్టించండి- డిక్ట్1 మరియు డిక్ట్2- నిర్దిష్ట సమాచారాన్ని నిల్వ చేయడానికి:
dict1 = {"user_id": ["001", "002", "003", "004", "005"],
"FName": ["John", "Brad", "Ron", "Roald", "Chris"],
"LName": ["Harley", "Cohen", "Dahl", "Harrington", "Kerr-Hislop"]}
dict2 = {"user_id": ["001", "002", "003", "004"], "Age": [15, 28, 34, 24]}
గుర్తుంచుకోండి, మీ డేటాఫ్రేమ్లను తర్వాత కలపడానికి ప్రాథమిక కీగా పని చేయడానికి, మీరు రెండు నిఘంటువు విలువలలో ఒక సాధారణ మూలకాన్ని కలిగి ఉండాలని గుర్తుంచుకోండి.
మీ నిఘంటువులను డేటాఫ్రేమ్లుగా మార్చండి
మీ నిఘంటువు విలువలను డేటాఫ్రేమ్లుగా మార్చడానికి, మీరు ఈ క్రింది పద్ధతిని ఉపయోగించవచ్చు:
df1 = pd.DataFrame(dict1)
df2 = pd.DataFrame(dict2)
కొన్ని IDEలు డేటాఫ్రేమ్ ఫంక్షన్ను సూచించడం మరియు నొక్కడం ద్వారా డేటాఫ్రేమ్లోని విలువలను తనిఖీ చేయడానికి మిమ్మల్ని అనుమతిస్తాయి. రన్/ఎగ్జిక్యూట్ . అక్కడ చాలా ఉన్నాయి పైథాన్-అనుకూల IDEలు , కాబట్టి మీరు నేర్చుకునేందుకు సులభమైన దాన్ని మీరు ఎంచుకొని ఎంచుకోవచ్చు.
imessage ద్వారా ఆటలను ఎలా ఆడాలి
మీ డేటాఫ్రేమ్ల కంటెంట్లతో మీరు సంతృప్తి చెందిన తర్వాత, మీరు విలీన దశకు వెళ్లవచ్చు.
విలీనం ఫంక్షన్తో ఫ్రేమ్లను కలపడం
విలీనం ఫంక్షన్ అనేది మీరు రెండు డేటాఫ్రేమ్లను కలపడానికి ఉపయోగించే మొదటి పైథాన్ ఫంక్షన్. ఈ ఫంక్షన్ కింది డిఫాల్ట్ ఆర్గ్యుమెంట్లను తీసుకుంటుంది:
pd.merge(DataFrame1, DataFrame2, how= type of merge)
ఎక్కడ:
- pd పాండాస్ లైబ్రరీకి మారుపేరు.
- విలీనం డేటాఫ్రేమ్లను విలీనం చేసే ఫంక్షన్.
- డేటా ఫ్రేమ్1 మరియు డేటాఫ్రేమ్2 విలీనం చేయవలసిన రెండు డేటాఫ్రేమ్లు.
- ఎలా విలీనం రకాన్ని నిర్వచిస్తుంది.
కొన్ని అదనపు ఐచ్ఛిక ఆర్గ్యుమెంట్లు అందుబాటులో ఉన్నాయి, మీరు సంక్లిష్ట డేటా నిర్మాణాన్ని కలిగి ఉన్నప్పుడు వీటిని ఉపయోగించవచ్చు.
విలీన రకాన్ని ఎలా నిర్వచించాలో పరామితి కోసం మీరు వేర్వేరు విలువలను ఉపయోగించవచ్చు. ఈ రకమైన విలీనం మీకు తెలిసి ఉంటుంది డేటాబేస్ పట్టికలలో చేరడానికి SQLని ఉపయోగించారు .
టీ షర్టులు కొనడానికి ఉత్తమ ప్రదేశం
ఎడమ విలీనం
ఎడమ విలీన రకం మొదటి డేటాఫ్రేమ్ విలువలను అలాగే ఉంచుతుంది మరియు రెండవ డేటాఫ్రేమ్ నుండి సరిపోలే విలువలను లాగుతుంది.
కుడి విలీనం
సరైన విలీన రకం రెండవ DataFrame విలువలను అలాగే ఉంచుతుంది మరియు మొదటి DataFrame నుండి సరిపోలే విలువలను లాగుతుంది.
అంతర్గత విలీనం
అంతర్గత విలీన రకం రెండు డేటాఫ్రేమ్ల నుండి సరిపోలే విలువలను అలాగే ఉంచుతుంది మరియు సరిపోలని విలువలను తీసివేస్తుంది.
బాహ్య విలీనం
బాహ్య విలీన రకం అన్ని సరిపోలే మరియు సరిపోలని విలువలను కలిగి ఉంటుంది మరియు డేటాఫ్రేమ్లను ఏకీకృతం చేస్తుంది.
Concat ఫంక్షన్ను ఎలా ఉపయోగించాలి
ది కలుస్తుంది పైథాన్ యొక్క కొన్ని ఇతర విలీన ఫంక్షన్లతో పోలిస్తే ఫంక్షన్ అనువైన ఎంపిక. కాన్కాట్ ఫంక్షన్తో, మీరు డేటాఫ్రేమ్లను నిలువుగా మరియు అడ్డంగా కలపవచ్చు.
అయితే, ఈ ఫంక్షన్ను ఉపయోగించడంలో ఉన్న లోపం ఏమిటంటే, ఇది డిఫాల్ట్గా సరిపోలని విలువలను విస్మరిస్తుంది. కొన్ని ఇతర సంబంధిత ఫంక్షన్ల మాదిరిగానే, ఈ ఫంక్షన్కు కొన్ని ఆర్గ్యుమెంట్లు ఉన్నాయి, వీటిలో కొన్ని మాత్రమే విజయవంతమైన కలయికకు అవసరం.
concat(dataframes, axis=0, join='outer'/’inner’)
ఎక్కడ:
- కలుస్తుంది డేటాఫ్రేమ్స్లో చేరే ఫంక్షన్.
- డేటాఫ్రేమ్లు సంగ్రహించడానికి డేటాఫ్రేమ్ల క్రమం.
- అక్షం సంయోగం యొక్క దిశను సూచిస్తుంది, 0 సమాంతరంగా ఉంటుంది, 1 నిలువుగా ఉంటుంది.
- చేరండి బాహ్య లేదా లోపలి చేరికను నిర్దేశిస్తుంది.
పై రెండు డేటాఫ్రేమ్లను ఉపయోగించి, మీరు ఈ క్రింది విధంగా కాన్కాట్ ఫంక్షన్ని ప్రయత్నించవచ్చు:
# define the dataframes in a list format
df_merged_concat = pd.concat([df1, df2])
# print the results of the Concat function
print(df_merged_concat)
పై కోడ్లో అక్షం మరియు జాయిన్ ఆర్గ్యుమెంట్లు లేకపోవడం రెండు డేటాసెట్లను మిళితం చేస్తుంది. ఫలిత అవుట్పుట్లో మ్యాచ్ స్థితితో సంబంధం లేకుండా అన్ని ఎంట్రీలు ఉంటాయి.
పని చేయని Mac ని క్లిక్ చేసి లాగండి
అదేవిధంగా, మీరు concat ఫంక్షన్ యొక్క దిశ మరియు అవుట్పుట్ను నియంత్రించడానికి అదనపు ఆర్గ్యుమెంట్లను ఉపయోగించవచ్చు.
సరిపోలే అన్ని ఎంట్రీలతో అవుట్పుట్ని నియంత్రించడానికి:
# Concatenating all matching values between the two dataframes based on their columns
df_merged_concat = pd.concat([df1, df2], axis=1, join = 'inner')
print(df_merged_concat)
ఫలితం రెండు డేటాఫ్రేమ్ల మధ్య సరిపోలే అన్ని విలువలను మాత్రమే కలిగి ఉంటుంది.
పైథాన్తో డేటాఫ్రేమ్లను విలీనం చేయడం
డేటాఫ్రేమ్లు వాటి వశ్యత మరియు కార్యాచరణను పరిగణనలోకి తీసుకుని పైథాన్లో అంతర్భాగం. వారి బహుముఖ ఉపయోగాల దృష్ట్యా, మీరు చాలా సులభంగా వివిధ రకాల పనులను నిర్వహించడానికి వాటిని విస్తృతంగా ఉపయోగించవచ్చు.
మీరు ఇప్పటికీ Python DataFrames గురించి నేర్చుకుంటున్నట్లయితే, కొన్ని Excel ఫైల్లను దిగుమతి చేసుకోవడానికి ప్రయత్నించండి, ఆపై వాటిని విభిన్న విధానాలతో కలపండి.