金融界2025年6月11日消息,国家知识产权局信息显示,中国铁塔股份有限公司、北京大学申请一项名为“基于文本对图像进行检测的方法、装置以及电子设备”的专利,公开号CN120125916A,申请日期为2025年05月检测技术 。
专利摘要显示,本申请公开了一种基于文本对图像进行检测的方法、装置以及电子设备检测技术 。其中,该方法包括:获取目标文本和目标图像;将目标文本和目标图像输入至目标模型,其中,目标模型包括编码器、查询模块以及解码器,编码器至少用于对目标图像和目标文本进行特征提取,查询模块至少用于确定提取到的文本特征和图像特征之间的相似度,解码器至少用于基于交叉注意力机制对文本特征和图像特征进行交互;通过目标模型确定检测结果。
来源:金融界