Zëri virtual i NVIDIA ngjan si njeri i vërtetë

“Uncanny Valley” shpesh përdoret për të përshkruar inteligjencën artificiale (A.I.) që imiton sjelljen njerëzore. Por zëri i ri i Nvidia A.I. është shumë më realiste se gjithçka që kemi dëgjuar më parë. Duke përdorur një kombinim të A.I. dhe një regjistrim referimi njerëzor, zëri i artificial tingëllon pothuajse identik me një të vërtetë.

Në një video, ekipi krijues i Nvidia përshkruan procesin e arritjes së sintezës së saktë të zërit. Ekipi e barazon fjalimin me muzikën, duke shfaqur ritme komplekse dhe të nuancuara, fusha dhe timbre që nuk janë të lehta për t’u përsëritur. Nvidia po krijon mjete për të riprodhuar këto ndërlikime me A.I.

Nvidia merret me zërat A.I. në dy mënyra. E para është të trajnosh një model tekst-to-speech në një fjalim të mbajtur nga një njeri. Pas trajnimit të mjaftueshëm, modeli mund të marrë çdo futje të tekstit dhe ta shndërrojë atë në të folur. Metoda tjetër është konvertimi i zërit. Në këtë rast, programi përdor një skedar audio të një personi që flet dhe konverton zërin në një A.I. një, që përputhet me modelin dhe intonacionin.

Për përdorime praktike, Nvidia krahasohet me asistentët e panumërt virtualë që drejtojnë linjat e shërbimit ndaj klientit, si dhe ato të pranishme në pajisjet inteligjente si Alexa dhe Google Assistant. Nvidia thotë se kjo teknologji arrin shumë më tej, megjithatë. “Tekst-to-speech mund të përdoret në lojëra, për të ndihmuar individët me aftësi të kufizuara vokale ose për të ndihmuar përdoruesit të përkthejnë midis gjuhëve me zërin e tyre,” thuhet në postimin e blogut të Nvidia.

Nvidia po zhvillon një aftësi për të simuluar njerëzit duke përdorur A.I. Kohët e fundit kompania hyri në detaje se si krijoi një CEO virtual për Konferencën e tij të Teknologjisë GPU, i ndihmuar pjesërisht nga programi i tij Omniverse.