视觉媒体的层次化内容感知技术

成果单位:
发布时间:2025/12/17
浏览量:1

研发团队

北京交通大学信息与科学研究所赵耀教授

技术领域

先进通信

项目简介

项目简介:模拟人类视觉认知机制,提出从图像级到像素级的递进式感知框架,解决了计算机视觉中“由粗到细”识别的关键问题:层次化感知框架:构建“图像分解-局部感知-全局融合”模型,实现从物体类别识别(图像级)到部件定位(物体级)再到像素级细粒度分类的逐层细化。弱监督学习与智能标注:通过“识别-擦除相对抗”策略减少人工标注依赖,结合交互式学习技术,将单张图片标注时间从1小时缩短至分钟级,显著降低人力成本。
发展规划:结合大语言模型与生成式AI,探索更复杂的多模态感知场景,突破现有层次化感知的边界,提升模型在开放环境下的鲁棒性;与智能制造、智慧城市等领域结合,推动视频编辑、电子商务等场景的智能化升级。
应用范围:消费电子领域、图像处理与工业软件、自动驾驶(障碍物精准识别)、医疗影像分析(病灶定位)、智能交通(车路协同)等。