జనవరి 2023లో, Google వచన వివరణల ఆధారంగా సంగీతాన్ని రూపొందించగల ప్రయోగాత్మక AI సాధనం MusicLMని ప్రకటించింది. వార్తలతో పాటు, Google MusicLM కోసం ఒక అద్భుతమైన పరిశోధనా పత్రాన్ని విడుదల చేసింది, ఇది గాలి నుండి సంగీతాన్ని మాయాజాలం చేయగల సామర్థ్యాన్ని చూసి చాలా మందిని అబ్బురపరిచింది.
రోజు యొక్క వీడియోను తయారు చేయండి కంటెంట్తో కొనసాగడానికి స్క్రోల్ చేయండి
టెక్స్ట్ ప్రాంప్ట్తో, మోడల్ హై ఫిడిలిటీ మ్యూజిక్ను ఉత్పత్తి చేస్తుందని వాగ్దానం చేసింది, ఇది కళా ప్రక్రియ నుండి వాయిద్యం వరకు ప్రసిద్ధ కళాకృతులను వివరించే వియుక్త శీర్షికల వరకు అన్ని రకాల వివరణలను అందించింది. ఇప్పుడు MusicLM ప్రజలకు అందుబాటులో ఉంది, మేము దానిని పరీక్షించాలని నిర్ణయించుకున్నాము.
AI మ్యూజిక్ జనరేటర్ను రూపొందించడానికి Google ప్రయత్నం
'రిలాక్సింగ్ జాజ్' వంటి టెక్స్ట్ ప్రాంప్ట్ని ప్లే చేయడానికి సిద్ధంగా ఉన్న ట్రాక్గా మార్చడం అనేది AI సంగీతంలో ప్రయోగాల యొక్క హోలీ గ్రెయిల్. డాల్-ఇ లేదా మిడ్జర్నీ వంటి ప్రసిద్ధ AI ఇమేజ్ జనరేటర్ల మాదిరిగానే, మెలోడీ మరియు బీట్ ఉన్న ట్రాక్ను రూపొందించడానికి మీకు సంగీత పరిజ్ఞానం అవసరం లేదు.
మే 2023లో, Google AI టెస్ట్ కిచెన్కి సైన్ అప్ చేసిన వారు మొదటిసారి డెమోని ప్రయత్నించవచ్చు. వినియోగదారు-స్నేహపూర్వక వెబ్ పేజీ మరియు కొన్ని మార్గదర్శక నియమాలు-ఎలక్ట్రానిక్ మరియు క్లాసికల్ ఇన్స్ట్రుమెంట్లు ఉత్తమంగా పని చేస్తాయి మరియు 'వైబ్'ని పేర్కొనడం మర్చిపోవద్దు—సంగీత స్నిప్పెట్ను రూపొందించడం ఊహించలేని విధంగా సులభం.
సాపేక్షంగా అధిక విశ్వసనీయ నమూనాలతో పాటు MusicLM నిజంగా అందించే కొన్ని విషయాలలో వేగం ఒకటి. అయితే, నిజమైన పరీక్ష కేవలం స్టాప్వాచ్తో కొలవబడదు. MusicLM కొన్ని పదాల ఆధారంగా నిజమైన, వినగలిగే సంగీతాన్ని ఉత్పత్తి చేయగలదా? సరిగ్గా లేదు (మేము దీనికి త్వరలో వస్తాము).
Google యొక్క AI టెస్ట్ కిచెన్లో MusicLMని ఎలా ఉపయోగించాలి
MusicLMని ఉపయోగించడం సులభం, మీరు వెయిట్లిస్ట్కి సైన్ అప్ చేయవచ్చు Google యొక్క AI టెస్ట్ కిచెన్ మీరు దానిని ఉపయోగించాలనుకుంటే.
వెబ్ యాప్లో, మీరు టెక్స్ట్ బాక్స్ని చూస్తారు, ఇక్కడ మీరు వినాలనుకుంటున్న సంగీతాన్ని వివరించే కొన్ని పదాల నుండి కొన్ని వాక్యాల వరకు ప్రాంప్ట్ను కంపోజ్ చేయవచ్చు. ఉత్తమ ఫలితాల కోసం, Google మీకు 'చాలా వివరణాత్మకంగా ఉండమని' సలహా ఇస్తుంది, మీరు సంగీతం యొక్క మానసిక స్థితి మరియు భావోద్వేగాలను చేర్చడానికి ప్రయత్నించాలి.
మీరు సిద్ధంగా ఉన్నప్పుడు, ప్రాసెసింగ్ ప్రారంభించడానికి ఎంటర్ నొక్కండి. దాదాపు 30 సెకన్లలోపు, మీరు ఆడిషన్ కోసం రెండు ఆడియో స్నిప్పెట్లు అందుబాటులో ఉంటాయి. రెండింటి నుండి, మీ ప్రాంప్ట్కు సరిపోయే ఉత్తమ నమూనాకు ట్రోఫీని ప్రదానం చేసే అవకాశం మీకు ఉంది, ఇది మోడల్కు శిక్షణ ఇవ్వడం మరియు దాని అవుట్పుట్ను మెరుగుపరచడంలో Googleకి సహాయపడుతుంది.
కంప్యూటర్ ఆన్లో ఉంది కానీ స్క్రీన్ నల్లగా ఉంది
MusicLM ఎలా అనిపిస్తుంది
మానవులు కనీసం 40,000 సంవత్సరాల క్రితం నుండి సంగీతాన్ని తయారు చేస్తున్నారు, సంగీతం భాష అభివృద్ధి చెందడానికి ముందు, తర్వాత లేదా అదే సమయంలో వచ్చిందా అనే ఖచ్చితమైన ఆలోచన లేదు. కాబట్టి కొన్ని మార్గాల్లో, MusicLM ఈ పురాతన సార్వత్రిక కళపై కోడ్ను ఛేదించకపోవడంలో ఆశ్చర్యం లేదు.
Google యొక్క MusicLM పరిశోధనా పత్రం MusicLM ప్రసిద్ధ కళాఖండాలకు చెందిన శీర్షికల నుండి సంగీతాన్ని రూపొందించగలదని మరియు విభిన్న ప్రాంప్ట్ల క్రమాన్ని అనుసరించి జానర్ లేదా మూడ్ని సున్నితమైన పద్ధతిలో మార్చడం వంటి సూచనలను అనుసరించవచ్చని సూచించింది.
అయితే, ఇంత పెద్ద ఆర్డర్లను పొందడానికి ముందు, MusicLMకి ముందుగా అధిగమించడానికి అనేక ప్రాథమిక సమస్యలు ఉన్నాయని మేము కనుగొన్నాము.
టెంపోకు అంటుకోవడం కష్టం
ఏ సంగీతకారుడి యొక్క ప్రాథమిక పని సమయానికి ప్లే చేయడం. మరో మాటలో చెప్పాలంటే, టెంపోకు కట్టుబడి ఉండండి. ఆశ్చర్యకరంగా, ఇది MusicLM 100% సమయం చేయగలిగింది కాదు.
వాస్తవానికి, 20 మ్యూజిక్ ట్రాక్లను ఉత్పత్తి చేసే అదే ప్రాంప్ట్ను 10 సార్లు ఉపయోగించి, మూడు మాత్రమే సమయానికి వచ్చాయి. మిగిలిన 17 నమూనాలు సంగీతాన్ని వివరించడానికి విస్తృతంగా ఉపయోగించే పదం 'నిమిషానికి బీట్స్'లో వ్రాయబడిన పేర్కొన్న టెంపో కంటే వేగంగా లేదా నెమ్మదిగా ఉన్నాయి.
ఈ ఉదాహరణలో, మేము 'సోలో క్లాసికల్ పియానో నిమిషానికి 80 బీట్స్తో ప్లే చేసాము, శాంతియుతంగా మరియు ధ్యానంతో' అనే ప్రాంప్ట్ని ఉపయోగించాము. దగ్గరగా వినడం వలన, చిన్న నమూనా పొడవులో సంగీతం తరచుగా వేగవంతమవుతుంది లేదా మందగిస్తుంది.
సంగీతం కూడా బలమైన బీట్ లేదు మరియు ముక్క మధ్యలో ప్లే చేయడాన్ని ఎవరో నొక్కినట్లు అనిపించింది. ఇది ఉద్దేశపూర్వకంగా జరిగినదా కాదా, MusicLM నిజానికి బీట్కి అతుక్కొని సంగీతానికి సరైన ప్రారంభాన్ని లేదా ముగింపుని కంపోజ్ చేయగలదా అని నిర్ధారించడం కష్టతరం చేస్తుంది.
యాదృచ్ఛిక సాధన ఎంపిక
బహుశా MusicLM కచ్చితమైన టైమింగ్లో ఎలా ప్లే చేయాలో ఇంకా నేర్చుకోలేదు, కాబట్టి మేము మరొక సాధారణ సంగీత పరామితికి వెళ్లాము. మేము కొన్ని సాధనాల కోసం మా అభ్యర్థనను మంజూరు చేస్తుందో లేదో చూడాలనుకుంటున్నాము.
మేము 'సోలో సింథసైజర్' మరియు 'సోలో బాస్ గిటార్' వంటి వివరణలను కలిగి ఉన్న అనేక విభిన్న ప్రాంప్ట్లను వ్రాసాము. ఇతరులు 'స్ట్రింగ్ క్వార్టెట్' లేదా 'జాజ్ బ్యాండ్' వంటి పెద్ద బృందాలు. మొత్తం మీద, మీరు కోరినది పొందే అవకాశం 50:50 లాగా అనిపించింది.
ఒక సిద్ధాంతం ఏమిటంటే, మోడల్ కొన్ని వాయిద్యాలను ప్రసిద్ధ సంగీత శైలులతో అనుబంధిస్తుంది. ఉదాహరణకు, 'సోలో సింథసైజర్, తీగ పురోగతి. లైవ్లీ అండ్ అప్బీట్' అనే ప్రాంప్ట్ని తీసుకోండి. సింథసైజర్ ధ్వనిని సొంతంగా పొందడానికి బదులుగా, MusicLM డ్రమ్స్ మరియు బాస్లతో పూర్తి ఎలక్ట్రానిక్ ట్రాక్ను ఉత్పత్తి చేసింది.
పరికరం కోసం నిర్దిష్ట అభ్యర్థనను అర్థం చేసుకోవడానికి మోడల్కు తగినంత డేటా మరియు తగినంత శిక్షణ ఉండకపోవచ్చు.
వోకల్స్ ఆర్ అవుట్ ఆఫ్ ది ఈక్వేషన్
ఆ సమయంలో ఉన్న పరిమితుల ప్రకారం, మోడల్ గాత్రాన్ని కలిగి ఉన్న సంగీతాన్ని ఉత్పత్తి చేయదు. MusicLM యొక్క విసుగు పుట్టించే కాపీరైట్ సమస్యలు మరియు బగ్గీ గానం ఈ పరిమితిని సెట్ చేయడం ద్వారా Google దీన్ని సురక్షితంగా ప్లే చేయడానికి ఎందుకు ఎంచుకుంది అనేదానికి కారణం కావచ్చు.
కానీ కొంతకాలం MusicLMతో ప్రయోగాలు చేసిన తర్వాత, మోడల్ అవుట్పుట్పై Google యొక్క నియంత్రణ ఖచ్చితంగా ఉక్కుపాదం కాదని మేము గ్రహించాము. విచిత్రమేమిటంటే, 'అకౌస్టిక్ గిటార్' వంటి ప్రాంప్ట్ ఒక ట్రాక్ను ఉత్పత్తి చేస్తుంది, ఇది నేపథ్యంలో దెయ్యం-వంటి గాత్రాలను కలిగి ఉంటుంది, అది మూగగా మరియు దూరంగా ఉంటుంది.
ఇది సాధారణ సంఘటన కానప్పటికీ, మొదటి స్థానంలో నమ్మదగిన గాత్రాన్ని సృష్టించగల MusicLM సామర్థ్యం గురించి ఇది మిమ్మల్ని ఆశ్చర్యపరుస్తుంది.
VOCALOID మరియు Synthesizer V వంటి సాఫ్ట్వేర్లతో ముందుండి AI-సహాయక స్వర సంశ్లేషణ సాంకేతికత , ప్రస్తుత మోడల్ నుండి గాత్రాన్ని వదిలివేయడం వలన ఇది ఇప్పటికే ఉన్న సాంకేతికతకు వ్యతిరేకంగా పోటీ పడటానికి ఇంకా సరిపోలేదా అని మాకు ఆశ్చర్యం కలిగిస్తుంది. సంగీతకారులు దాని ప్రశంసలను పాడటానికి ముందు MusicLM చాలా దూరం వెళ్ళవలసి ఉంటుంది.
AI మ్యూజిక్ జనరేటర్ల భవిష్యత్తు
MusicLM ఉత్పాదక AI సంగీత సాంకేతికతను ముందుకు తీసుకెళ్లినప్పటికీ, సంగీత పరిశ్రమలో ఆచరణాత్మక పనిని చేపట్టడానికి ముందు అది పాఠశాలకు తిరిగి వెళ్లాలి మరియు మరికొన్ని విషయాలను నేర్చుకోవాలి.
ఇంతకు ముందు, జనరేటివ్ AI సంగీతంలో అత్యుత్తమ ప్రయత్నం OpenAI ద్వారా JukeboxAI అనే మోడల్. ఇది ఖచ్చితంగా ఉపయోగించడానికి సిద్ధంగా ఉన్న స్థితిలో లేదు మరియు కేవలం ఒక నిమిషం సంగీతాన్ని అందించడానికి తొమ్మిది గంటల సమయం పట్టింది.
మీ ప్రయత్నాల కోసం, మీరు ఆడియో వక్రీకరణ మరియు కళాఖండాలతో కూడిన నిజమైన గ్రహాంతర-ధ్వని ట్రాక్ని తిరిగి పొందే అవకాశం ఉంది. పైకి, మీరు విసుగు చెందడం లేదు జూక్బాక్స్ మాయాజాలం చేసే విచిత్రమైన క్రియేషన్లను వినడం .
దీని వెలుగులో, MusicLM వినియోగదారు-స్నేహపూర్వక AI మ్యూజిక్ జనరేటర్ వైపు కొన్ని ముఖ్యమైన పురోగతులను చేసింది. ముడి ఆడియో రూపంలో సంగీతాన్ని రూపొందించడం ఎంత క్లిష్టంగా ఉంటుందో మీరు ఆలోచించడం ఆపివేసినప్పుడు దాని యాదృచ్ఛిక అవుట్పుట్ల కోసం మేము మోడల్ను దాదాపు క్షమించగలము.
అయితే, మోడల్ను పనిలో ఉంచిన తర్వాత, Google దాని ప్రారంభ పరిశోధనా పత్రంలో ప్రచురించిన దానితో పోల్చినప్పుడు MusicLM సగం కాల్చినట్లు అనిపిస్తుంది. అరుదుగా AI ఇమేజ్ జనరేటర్ Apple యొక్క ఇమేజ్ని తప్పుగా పొందుతుంది, అలాగే AI మ్యూజిక్ జనరేటర్ కూడా టెంపో మరియు ఇన్స్ట్రుమెంట్స్ వంటి కొన్ని ప్రాథమిక అంశాలను పొందాలి.
Google యొక్క MusicLM అంచనాలకు తగ్గట్టుగా ఉంది
AI ముందు భాగంలో ఒకదానికొకటి పోటీ పడటానికి సాంకేతిక కంపెనీలు పోటీ పడుతుండడంతో, MusicLM సిద్ధంగా ఉండకముందే పబ్లిక్ ట్రయల్స్లోకి ప్రవేశించినట్లు అనిపిస్తుంది. ప్రాథమికాలను సరిగ్గా పొందడానికి బదులుగా, మోడల్ సంగీతాన్ని రూపొందించడానికి చాలా అస్పష్టమైన మరియు ఆత్మాశ్రయ విధానాన్ని తీసుకుంటుంది.
యూట్యూబ్ కోసం ఉత్తమ వీడియో ఎడిటింగ్ సాఫ్ట్వేర్
మీ ప్రాంప్ట్తో నిర్దిష్టంగా ఉండమని Google మిమ్మల్ని ప్రోత్సహిస్తుంది, కానీ అది టెంపోను సరిగ్గా నిర్వహించలేకపోతుంది మరియు మీరు కోరిన ప్రతిసారీ సాధనాలను పొందగలమని మీకు హామీ లేదు. MusicLM ఆసక్తికరంగా ఉండవచ్చు మరియు శక్తివంతమైన AI పురోగతికి మంచి ప్రదర్శన, కానీ సంగీతం అంతిమ లక్ష్యం అయితే అది ఇంకా చాలా దూరం ప్రయాణించవలసి ఉంది.