మూడు కొత్త USE బహుభాషా గుణకాలు టెన్సార్‌ఫ్లోకి వస్తున్నాయి

టెక్ / మూడు కొత్త USE బహుభాషా గుణకాలు టెన్సార్‌ఫ్లోకి వస్తున్నాయి 2 నిమిషాలు చదవండి

Google వాయిస్ శోధన



AI పరిశోధన యొక్క మార్గదర్శకులలో గూగుల్ ఒకరు మరియు వారి ప్రాజెక్టులు చాలా వరకు తలదాచుకున్నాయి. ఆల్ఫాజీరో Google నుండి డీప్‌మైండ్ AI యొక్క పరిశోధనలో బృందం ఒక పురోగతి, ప్రోగ్రామ్ యొక్క సంక్లిష్ట ఆటలను స్వయంగా నేర్చుకునే సామర్థ్యం కారణంగా (మానవ శిక్షణ మరియు జోక్యం లేకుండా). గూగుల్ కూడా అద్భుతమైన పని చేసింది సహజ భాషా ప్రాసెసింగ్ కార్యక్రమాలు (NLP లు), ఇది మానవ ప్రసంగాన్ని అర్థం చేసుకోవడంలో మరియు ప్రాసెస్ చేయడంలో గూగుల్ అసిస్టెంట్ యొక్క సామర్థ్యం వెనుక ఒక కారణం.

గూగుల్ ఇటీవల మూడు కొత్త విడుదలలను ప్రకటించింది బహుభాషా మాడ్యూళ్ళను ఉపయోగించండి మరియు అర్థపరంగా సారూప్య వచనాన్ని తిరిగి పొందడానికి మరిన్ని బహుభాషా నమూనాలను అందించండి.



మొదటి రెండు గుణకాలు అర్థపరంగా సారూప్య వచనాన్ని తిరిగి పొందటానికి బహుభాషా నమూనాలను అందిస్తాయి, ఒకటి తిరిగి పొందే పనితీరు కోసం ఆప్టిమైజ్ చేయబడింది మరియు మరొకటి వేగం మరియు తక్కువ మెమరీ వినియోగం కోసం. మూడవ మోడల్ కోసం ప్రత్యేకమైనది ప్రశ్న-సమాధానం తిరిగి పొందడం పదహారు భాషలలో (USE-QA) మరియు USE యొక్క పూర్తిగా క్రొత్త అనువర్తనాన్ని సూచిస్తుంది. మూడు బహుభాషా గుణకాలు a ను ఉపయోగించి శిక్షణ పొందుతాయి బహుళ-పని ద్వంద్వ-ఎన్కోడర్ ఫ్రేమ్‌వర్క్ , ఇంగ్లీష్ కోసం అసలు USE మోడల్ మాదిరిగానే, మెరుగుపరచడానికి మేము అభివృద్ధి చేసిన పద్ధతులను ఉపయోగిస్తున్నప్పుడు సంకలిత మార్జిన్ సాఫ్ట్‌మాక్స్ విధానంతో ద్వంద్వ-ఎన్‌కోడర్ . అవి మంచి బదిలీ అభ్యాస పనితీరును నిర్వహించడానికి మాత్రమే కాకుండా, సెమాంటిక్ రిట్రీవల్ పనులను చక్కగా నిర్వహించడానికి రూపొందించబడ్డాయి.



ప్రాథమిక సింటాక్స్ ట్రీ పార్సింగ్ నుండి పెద్ద వెక్టర్ అసోసియేషన్ నమూనాల వరకు వ్యవస్థలలో భాషా ప్రాసెసింగ్ చాలా ముందుకు వచ్చింది. టెక్స్ట్‌లో సందర్భాన్ని అర్థం చేసుకోవడం ఎన్‌ఎల్‌పి ఫీల్డ్‌లోని అతిపెద్ద సమస్యలలో ఒకటి మరియు యూనివర్సల్ సెంటెన్స్ ఎన్‌కోడర్ టెక్స్ట్‌ను హై డైమెన్షనల్ వెక్టర్స్‌లో మార్చడం ద్వారా దీనిని పరిష్కరిస్తుంది, ఇది టెక్స్ట్ ర్యాంకింగ్ మరియు డినోటేషన్‌ను సులభతరం చేస్తుంది.



యుటిఇ మార్కింగ్ స్ట్రక్చర్ సోర్స్ - గూగుల్ బ్లాగ్

గూగుల్ ప్రకారం, “ మూడు కొత్త గుణకాలు అన్నీ సెమాంటిక్ రిట్రీవల్ ఆర్కిటెక్చర్‌పై నిర్మించబడ్డాయి, ఇవి సాధారణంగా ప్రశ్నలు మరియు సమాధానాల ఎన్‌కోడింగ్‌ను ప్రత్యేక న్యూరల్ నెట్‌వర్క్‌లుగా విభజిస్తాయి, ఇది మిల్లీసెకన్లలో బిలియన్ల సంభావ్య సమాధానాల మధ్య శోధించడం సాధ్యపడుతుంది. ”మరో మాటలో చెప్పాలంటే, ఇది డేటాను బాగా ఇండెక్స్ చేయడానికి సహాయపడుతుంది.

' మూడు బహుభాషా గుణకాలు a ను ఉపయోగించి శిక్షణ పొందుతాయి బహుళ-పని ద్వంద్వ-ఎన్కోడర్ ఫ్రేమ్‌వర్క్ , ఇంగ్లీష్ కోసం అసలు USE మోడల్ మాదిరిగానే, మెరుగుపరచడానికి మేము అభివృద్ధి చేసిన పద్ధతులను ఉపయోగిస్తున్నప్పుడు సంకలిత మార్జిన్ సాఫ్ట్‌మాక్స్ విధానంతో ద్వంద్వ-ఎన్‌కోడర్ . అవి మంచి బదిలీ అభ్యాస పనితీరును నిర్వహించడానికి మాత్రమే కాకుండా, సెమాంటిక్ రిట్రీవల్ పనులను చక్కగా నిర్వహించడానికి రూపొందించబడ్డాయి . ” సాఫ్ట్‌మాక్స్ ఫంక్షన్ తరచుగా వెక్టర్లను ఘాటు చేయడం ద్వారా గణన శక్తిని ఆదా చేయడానికి మరియు ప్రతి మూలకాన్ని ఎక్స్‌పోనెన్షియల్ మొత్తంతో విభజించడానికి ఉపయోగిస్తారు.



సెమాంటిక్ రిట్రీవల్ ఆర్కిటెక్చర్

'మూడు కొత్త మాడ్యూల్స్ అన్నీ సెమాంటిక్ రిట్రీవల్ ఆర్కిటెక్చర్లపై నిర్మించబడ్డాయి, ఇవి సాధారణంగా ప్రశ్నలు మరియు సమాధానాల ఎన్కోడింగ్‌ను ప్రత్యేక న్యూరల్ నెట్‌వర్క్‌లుగా విభజిస్తాయి, ఇది మిల్లీసెకన్లలో బిలియన్ల సంభావ్య సమాధానాల మధ్య శోధించడం సాధ్యపడుతుంది. సమర్థవంతమైన సెమాంటిక్ రిట్రీవల్ కోసం డ్యూయల్ ఎన్‌కోడర్‌లను ఉపయోగించడంలో కీలకం ఏమిటంటే అభ్యర్థి సమాధానాలను expected హించిన ఇన్‌పుట్ ప్రశ్నలకు ముందే ఎన్కోడ్ చేయడం మరియు వాటిని పరిష్కరించడానికి ఆప్టిమైజ్ చేసిన వెక్టర్ డేటాబేస్లో నిల్వ చేయడం. సమీప పొరుగు సమస్య , ఇది మంచి సంఖ్యలో పెద్ద సంఖ్యలో అభ్యర్థులను త్వరగా శోధించడానికి అనుమతిస్తుంది ఖచ్చితత్వం మరియు రీకాల్ . '

మీరు ఈ మాడ్యూళ్ళను టెన్సార్ ఫ్లో హబ్ నుండి డౌన్‌లోడ్ చేసుకోవచ్చు. మరింత చదవడానికి GoogleAI పూర్తి చూడండి బ్లాగ్పోస్ట్ .

టాగ్లు google