Kérdezd meg Siri-t: Hogyan tanít az Apple az A.I. a kedvenc éttermünk neve

ЗАРАБОТАЛО! ЭКГ на Apple Watch в России

ЗАРАБОТАЛО! ЭКГ на Apple Watch в России
Anonim

Az Apple megpróbálta megakadályozni a nyelvi és kereskedelmi akadályokat, amelyek jelenleg a felhasználók és a Siri között léteznek: az A.I. a helyi vállalkozások nevét. Terve? A rendszer hozzáférhetővé tétele a felhasználók földrajzi elhelyezkedésének megismeréséhez, hogy megértse az egyes környékbeli éttermek, butikok és hardver üzletek.

Az Apple ezt a technikát „geolokáció alapú nyelvi modellek” vagy Geo-LM-ek rövidítették. És egy csütörtök blogbejegyzésben a cég gépi tanulási folyóiratában, a Siri beszédfelismerő csoportja elmagyarázta, hogy ezt fogják használni, hogy zökkenőmentesen hozza létre a helyi pizza közösségéről szóló információt, ahelyett, hogy válaszolna a védjegyre: „Sajnálom, nem értem teljesen.”

A Siri egy automatikus beszédfelismerő (ASR) rendszer, amely két egységből, egy akusztikus modellből és egy nyelvi modellből áll. Az előbbi rögzíti a szavakat és a hangokat, amikor valaki beszél, míg az előbbi meghatározza, hogy egy bizonyos szavak sora milyen valószínűséggel van a beszélt nyelven. Lényegében Siri a legjobban megtanulja, hogy megértse, mit kérdez.

Az Apple két érdekes hiányosságot azonosított. Egyrészt egyes üzleti szavak és nevek nem használhatók a szokásos párbeszédben, ezért ritkán jelennek meg a rendszer képzési adataiban, és nem tudja megmondani, hogy a felhasználók hogyan mondják ki ezeket a szavakat vagy neveket.

A javítás megkísérlése érdekében a Geo-LM a Siri számára hozzáférést biztosít a „entitásnevek” nevéhez. A hang-asszisztens jobban megjósolhatja, mikor beszél egy étteremről, és nem egy parkról, amely hasonló nevet.

Az Apple az Egyesült Államok népszámlálási irodája adataiból 169 területből állította össze Geo-LM-et, amely az Egyesült Államok lakosságának 80% -át fedi le. Globális Geo-LM-t is építettek minden olyan régió számára, amely nem szerepel ezen a területen. Tehát, ha egy felhasználó megkéri a Sirit, hogy keressen egy helyi élelmiszerboltot, amelyre nem vonatkozott a népszámlálási adatok, akkor a globális Geo-LM-t használja.

Bár ez betöltheti néhány hiányosságot a Siri-ban, az Apple még mindig elmarad a Google-tól, amely jelenleg a következő generációs hang-asszisztensét, a Duplex-et képezi, amely képes hiper-reális emberi hangon hívásokat kezdeményezni. Fontos azonban megjegyezni, hogy a Google is törekszik a Google asszisztens azon képességének javítására, hogy megértse a különböző ékezeteket, nyelvjárásokat és nyelveket.

A blogbejegyzés nem határozta meg, hogy a frissítés melyik napon kerüljön alkalmazásra. De reméljük, kérheted Siri-t, hogy rendeljen Denino pizzájától anélkül, hogy véletlenül meghívná Dino barátját.