视觉媒体的层次化内容感知技术-创新成果-全国高校区域技术转移转化中心(江苏)

创新成果

首页 - 高校成果 - 创新成果

研发团队	北京交通大学信息与科学研究所赵耀教授
技术领域	先进通信
项目简介	项目简介：模拟人类视觉认知机制，提出从图像级到像素级的递进式感知框架，解决了计算机视觉中“由粗到细”识别的关键问题：层次化感知框架：构建“图像分解-局部感知-全局融合”模型，实现从物体类别识别（图像级）到部件定位（物体级）再到像素级细粒度分类的逐层细化。弱监督学习与智能标注：通过“识别-擦除相对抗”策略减少人工标注依赖，结合交互式学习技术，将单张图片标注时间从1小时缩短至分钟级，显著降低人力成本。发展规划：结合大语言模型与生成式AI，探索更复杂的多模态感知场景，突破现有层次化感知的边界，提升模型在开放环境下的鲁棒性；与智能制造、智慧城市等领域结合，推动视频编辑、电子商务等场景的智能化升级。应用范围：消费电子领域、图像处理与工业软件、自动驾驶（障碍物精准识别）、医疗影像分析（病灶定位）、智能交通（车路协同）等。