微软专利为AR/VR远程会议提供“讲话人”视觉指示器自动化系统
视觉指示器自动化系统
(映维网Nweon 2024年07月20日)远程会议的发展正在促进元宇宙的普及。然而,当前在线会议应用使用元环境的其中一个主要问题是,会议参与者可能难以识别相关的用户活动,例如正在讲话的人员。当用户界面安排包括2D和3D渲染的组合时,这个问题可能会加剧。
所述问题可能会导致效率低下,并导致计算设备和用户之间的无效交互,特别是在通信会话期间。所以在名为“Automation of visual indicators for distinguishing active speakers of users displayed as three-dimensional representations”的专利申请中,微软介绍了一种用于区分活跃说话者或显示为三维表示用户的视觉指示器自动化系统。
图1A和1B举例说明了一个UI转换的例子。通信会话可由由若干台计算机11组成的系统100来管理,每台计算机11对应于若干用户。每个用户可以在用户界面中显示为2D图像151,或者每个用户可以在用户界面中显示为3D表示251。所述2D图像151可以是由指向用户的摄像头生成的静态图像或视频流。所述3D表示251可以是静态模型或动态模型,并具有响应用户输入的实时运动。
系统可以为在通信会话中主动发言的第二区域131选择用户的个人效果图。所述系统可以使用一个或多个阈值或标准来选择要在指定给主动说话人的第二区域131内显示的单个用户。例如,当检测到用户从麦克风产生音频信号时,系统可以在所述第二区域131内显示用户的呈现。
......(全文 3285 字,剩余 2804 字)
注册用户请登入后阅读完整文章
映维会员、PICO员工、大朋员工可联系映维免费获取权限