Нарийн төвөгтэй орчинд хүмүүс ярианы утгыг хиймэл оюун ухаанаас илүү сайн ойлгодог, учир нь бид зөвхөн чихээрээ төдийгүй нүдээ ашигладаг.
Жишээлбэл, бид хэн нэгний ам хөдөлж байгааг харж, бидний сонссон дуу тэр хүнээс гарч байгаа гэдгийг зөн совингоор мэдэж болно.
Meta AI нь хиймэл оюун ухаанд харилцан ярианы явцад харж, сонсож буй зүйлсийн хоорондын нарийн уялдаа холбоог таньж сурахад сургах шинэ ярианы систем дээр ажиллаж байна.
VisualVoice нь хүмүүс шошгогүй видеонуудаас харааны болон сонсголын дохиог сурах замаар аудио-визуал яриаг ялгах боломжийг олгодог шинэ ур чадвар эзэмшиж сурдагтай ижил аргаар суралцдаг.
Машинуудын хувьд энэ нь илүү сайн ойлголтыг бий болгодог бол хүний ойлголт сайжирдаг.
Дэлхийн өнцөг булан бүрээс ирсэн хамт олонтойгоо бүлгийн уулзалтад оролцож, виртуал орон зайд шилжих үед жижиг бүлгийн уулзалтуудад нэгдэх боломжтой гэж төсөөлөөд үз дээ. Энэ үеэр үзэгдэл дэх дууны эгшиг, тембр нь хүрээлэн буй орчны дагуу хийгддэг.
Өөрөөр хэлбэл, энэ нь аудио, видео болон текст мэдээллийг нэгэн зэрэг авах боломжтой бөгөөд байгаль орчны талаархи ойлголтыг илүү баялаг загвартай бөгөөд хэрэглэгчдэд "маш гайхалтай" дууг мэдрэх боломжийг олгодог.
Шуудангийн цаг: 2022 оны 7-р сарын 20