2024年北航深圳研究院深圳市智慧城市重点实验室产出多项科技成果,其中专利“语义分割方法和语义分割装置”,“一种基于级联优化的行人目标检测方法”,“模型训练方法、贴图确定方法、装置、设备”,“光源模型参数获取方法、训练方法、设备和介质”,“网格线性结构恢复方法、装置、电子设备及存储介质”等获得授权。
(1)语义分割方法和语义分割装置
该专利提供了一种语义分割方法和语义分割装置,有利于提高语义分割结果准确率。该方法包括:获取目标图像,该目标图像包括航拍得到的RGB图像和深度图像,该深度图像是根据该RGB图像确定的;将该目标图像输入至语义分割网络,通过该语义分割网络对该目标图像进行特征提取,获取该目标图像的深度信息和语义信息,该特征提取包括细节特征提取、边缘特征提取、深度特征提取以及上下文特征提取;通过该语义分割网络对该深度信息和该语义信息进行特征融合,得到该目标图像的语义分割图像。
(2)一种基于级联优化的行人目标检测方法
本发明涉及一种基于级联优化的行人检测方法,属于计算机视觉中的行人检测领域。首先利用基于无监督注意力机制的候选区域生成网络产生不同行人候选目标区域,然后利用设计的优化网络从不同特征层上提取候选目标区域,逐层对样本进行优化,最终得到准确的行人目标预测。
(3)模型训练方法、贴图确定方法、装置、设备
本公开提供的一种模型训练方法、贴图确定方法、装置、设备,涉及图形渲染技术,包括:获取训练数据集;训练数据集中包括多组训练数据,每组训练数据中包括目标对象的第一图像和多张第二图像,以及标注贴图;将第一图像和多张第二图像输入至预设模型中,得到目标对象的预测贴图;根据目标对象的标注贴图和预测贴图,调整预设模型中的参数,得到贴图预测模型。本方案可基于目标对象的一张在环境光下的图像和多张在点光源下的图像构成的训练数据,得到贴图预测模型;该贴图预测模型在使用时,输入对象的一张在环境光下的图像(包含材质颜色信息)和一张在点光源下的图像(包含材质的反射率信息),输出对象的贴图。过曝区域信息不会丢失。
(4)光源模型参数获取方法、训练方法、设备和介质
本申请提供一种光源模型参数获取方法、训练方法、设备和介质。该方法包括:将HDR图像转换成像素矩阵,根据各个像素点的灰度值进行区域生长,得到光源区域;将所述HDR图像转换成球坐标表示,得到所述光源区域包括在所述球坐标下的光源参数;在用球坐标表示下的LDR图像中选取第一局部图像,将第一局部图像映射到LDR图像中,得到第二局部图像;根据所述LDR图像的第一局部图像的中心点坐标,对光源参数和HDR图像的像素点进行旋转;根据所述第二局部图像、旋转后的光源参数和旋转后的HDR图像的像素点,获取光源模型参数。本申请的方法,增加了光源模型参数的表现力,保证了光源估计的准确性。
(5)网格线性结构恢复方法、装置、电子设备及存储介质
本申请提供一种光源模型参数获取方法、训练方法、设备和介质。该方法包括:将HDR图像转换成像素矩阵,根据各个像素点的灰度值进行区域生长,得到光源区域;将所述HDR图像转换成球坐标表示,得到所述光源区域包括在所述球坐标下的光源参数;在用球坐标表示下的LDR图像中选取第一局部图像,将第一局部图像映射到LDR图像中,得到第二局部图像;根据所述LDR图像的第一局部图像的中心点坐标,对光源参数和HDR图像的像素点进行旋转;根据所述第二局部图像、旋转后的光源参数和旋转后的HDR图像的像素点,获取光源模型参数。本申请的方法,增加了光源模型参数的表现力,保证了光源估计的准确性。
