Hogyan működik a Google Hum to Search funkciója

Tartalomjegyzék:

Hogyan működik a Google Hum to Search funkciója
Hogyan működik a Google Hum to Search funkciója
Anonim

Kulcs elvitelek

  • A Google elindított egy új eszközt, amely lehetővé teszi a felhasználók számára, hogy dúdolva, énekelve vagy fütyülve keressenek dalokat.
  • Az új eszköz gépi tanulást használ, hogy egy dúdolt zeneszámot több mint félmillió d alt tartalmazó adatbázissal párosítson, amely folyamatosan frissül.
  • A Google-felhasználók havonta közel 100 alkalommal kérdezik meg, hogy melyik d alt játsszák le.
Image
Image

A Google elindította a "Hum to Search" nevű új funkciót, hogy megoldjon egy frusztráló problémát: ha egy dal megakad a fejében, és nem tud rájönni, mi a neve.

Az ötlet, hogy dúdolva keressünk egy d alt, hihetetlenül egyszerűnek tűnik, akkor miért csak 2020-ban vezeti be a Google ezt a funkciót? Nos, kiderült, hogy a dalok ilyen módon történő azonosítása meglehetősen bonyolult, részben azért, mert a dúdolt verzióink meglehetősen különböznek az eredeti számtól. A Google mesterséges intelligencia blogján egy közelmúltbeli bejegyzésben elmagyarázza, hogyan oldotta meg ezt a problémát a gépi tanulással, és végül hogyan segített az embereknek megtalálni a d alt dúdolás, fütyülés vagy a dallam éneklésével, még akkor is, ha az előadás kevésbé pontos.

"A Hum to Search szolgáltatásban az a célunk, hogy segítsünk az embereknek azonosítani és megtalálni a fejükben megragadt zenét" - mondta a Google szóvivője a Lifewire-nek egy e-mailben.

Csak kezdj el dúdolni

A Google-felhasználók havonta majdnem 100 milliószor kérdezik meg, hogy melyik d alt játsszák le. Aparna Chennapragada, a Google fogyasztói vásárlásokért felelős alelnöke és vezérigazgatója elmondta egy videóban, amely számos új keresési funkciót mutat be. Most mód van rá, hogy megtudja.

A „Hum to Search” funkció a Google mobilalkalmazásába, a Google Kereső modulba és a Google Asszisztensbe van beépítve. Az alkalmazáson keresztüli eléréséhez koppintson a mikrofon ikonra, és mondja ki: „What’s this song?” A „Dal keresése” gomb kiválasztása is működik.

A megfelelő működéshez a funkció legalább 10-15 másodpercig tartó dúdolást igényel. Az Android-felhasználók dúdolva több mint 20 nyelven kereshetnek dalokat, míg iPhone-okon csak az angol dalok működnek. Az eszköz nem mindig képes azonnal beazonosítani egy d alt, de ha sikerül, az eredmények elég jók.

"A különféle változók (hangszín, hangmagasság, hangerő stb.) dalainak több mint felét felismerik algoritmusaink, de természetesen a pontosság függ a dúdolás minőségétől, a dúdolás típusától a d alt és még sok minden mást” – mondta a Google szóvivője a Lifewire-nek egy e-mailben. "De miután felismertük, ötből nagyjából négy válasz helyes."

Nem ez az első alkalom, hogy dúdolást használnak egy zeneazonosító alkalmazásban. A SoundHound hasonló funkciót kínál, amint azt a CNN Business megjegyezte, és Android és iOS rendszeren is elérhető. A Google szóvivője szerint az új funkció nem vet fel semmilyen adatvédelmi aggályt, és „nem változtatja meg a Google hangalapú interakcióinak kezelési módját” – mondták a Lifewire-nek egy e-mailben.

Gépi tanulás

A koncepció egyszerűsége ellenére egy dallamot dúdolni a stúdiófelvétel megtalálásához technikailag meglehetősen nehéz. Ennek több oka is van – magyarázza a Google Research Christian Frank november 12-i blogbejegyzésében. Először is, a dal dúdolt változata nagymértékben eltérhet a tényleges felvételtől, ami megnehezíti a kettő párosítását. Tehát bár a Shazam és számos más alkalmazás már létezik az étteremben vagy más nyilvános helyen hallott dal azonosítására, a dúdolt dallam használata a keresés alapjaként bonyolultabb lehet.

"Szövegekkel, háttérénekekkel és hangszerekkel egy musical- vagy stúdiófelvétel hangja egészen más lehet, mint egy dúdolt dallam" - írja Frank."Tévedésből vagy tervből, amikor valaki dúdolja egy dal interpretációját, gyakran a hangmagasság, a kulcs, a tempó vagy a ritmus kissé vagy akár jelentősen eltérhet."

Image
Image

Mivel a dalok dúdolt verziói nagyon eltérhetnek az eredetitől, Frank megjegyzi, hogy sok korábbi módszer megkövetelte, hogy egy személy dúdolását a dalnak egy olyan változatával párosítsák, amelyben csak dallam van, vagy olyan számmal, amelyik dúdolást is tartalmaz. Ez megnehezítette a valós használati eseteket, mivel az ilyen dalokat tartalmazó adatbázisok korlátozottak lehetnek, és manuálisan kell frissíteni őket.

A Google elmagyarázza, hogy a Hum to Search funkcióhoz gépi tanulási modelleket használ, hogy a hangot "számalapú sorozatmá" alakítsa, amely a dal dallamát reprezentálja – amit mond, azt "ujjlenyomatnak" tekinthetjük."

Felhasználóbarátabb

A gépi tanulás használata a Google Hum to Search funkciójában végső soron sokkal könnyebbé teszi az eszköz használatát a való világban. Mivel a Hum to Search összeegyezteti a kereső dúdolt dallamát az aktuális dallal, az eszköz képes együttműködni az új dalokkal, amint megjelennek egy adatbázis helyett, amelyet folyamatosan frissíteni kell az egyes számok dúdolt verzióival. Ráadásul nem kell tökéletes hangmagasság a használatához.

"A jelenlegi rendszer nagy pontosságot ér el egy több mint félmillió d alt tartalmazó adatbázisban, amelyet folyamatosan frissítünk" - mondta a Google a Hum to Search közleményében. "Ennek a dalkorpusznak még van hova fejlődnie, hogy még többet tartalmazzon a világ számos dallamából."

Ajánlott: