Meta提出CGH图像视频压缩技术,及压缩复杂全息图像视频的深度学习方法
图像和视频压缩技术
(映维网Nweon 2024年07月20日)全息近眼显示器可以提供高质量的3D图像,但在近眼显示中同时支持宽视场和大视窗的内容分辨率要求非常高。所以,产生的数据存储和流开销可能对实际应用构成重大挑战。
计算机生成全息(CGH)将光波前的二维切片表示为复值图像,即将全息平面的光场定义为实复值和虚复值的集合。这与传统的图像和视频域不同,并使得全息图具有其他显示技术不支持的独特属性。全息图允许用户聚焦在不同深度而不需要对所显示图像进行任何改变。根据眼睛的焦距,用户眼睛会以不同的方式组合虚实。
计算机生成全息同时需要高频干涉条纹来产生逼真的景深效果,而为了实现更高的压缩率,传统的图像和视频编解码器通常会丢弃对视觉无关紧要的高频细节。当现有编解码器应用于CGH时,不匹配的设计选择可能导致压缩性能不理想,尤其是需要宽视场和大视窗的的AR/VR应用,因为这可能会进一步放大编解码器的低效率并降低图像质量。
在名为“Systems and methods for computer-generated hologram image and video compression”的专利申请中,Meta提出了一种用于CGH的图像和视频压缩技术,并提供了用于有效压缩复杂值全息图像和视频的深度学习方法。
......(全文 3748 字,剩余 3305 字)
注册用户请登入后阅读完整文章
映维会员、PICO员工、大朋员工可联系映维免费获取权限