发布时间:2025-01-21
点击次数: 合成孔径雷达(sar)目标识别技术突破:国防科技大学团队构建首个sar图像目标识别基础模型
合成孔径雷达(Synthetic Aperture Radar, SAR)作为一种全天候对地观测技术,在军民领域应用广泛。然而,SAR图像目标识别(Automatic Target Recognition, ATR)面临诸多挑战,特别是复杂环境下的高精度、高效率识别。 国防科技大学电子科学学院刘永祥&刘丽教授团队针对这些挑战,提出了首个公开发布的SAR图像目标识别基础模型SARATR-X 1.0,并构建了相应的开源生态。
现有SAR目标识别方法存在技术和生态两方面瓶颈:技术层面,多为有监督、静态、单任务的单模型单平台方法,计算冗余高,泛化能力弱;生态层面,缺乏高质量的开源数据、代码和评
估基准。
SARATR-X 1.0模型的核心突破在于:
技术层面: 采用基于自监督学习的SAR目标特征表示学习方法,创新性地提出联合嵌入-预测自监督学习框架(SAR-JEPA),有效抑制SAR图像相干斑噪声,降低对标注数据的依赖。模型基于Transformer架构,参数规模达0.66亿。
生态层面: 团队构建了较大规模的SAR图像陆海目标识别数据集SARDet-180K,并创建了新的SAR车辆目标识别数据集NUDT4MSTAR(包含40种车辆型号,规模是同类型数据集的十倍以上),同时开源了相关算法代码和评估基准。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
图1. 各种专门的SAR ATR数据集和任务。现有数据集通常针对特定任务和设置,导致算法泛化困难。
SARATR-X 1.0模型的预训练过程分两步进行:首先在ImageNet数据集上进行预训练,然后利用SAR-JEPA框架在高质量SAR目标信号上进行预训练,以进一步提升模型性能。模型采用HiViT架构,能够更好地处理遥感图像中的小目标。
表1. SARATR-X用于预训练的14个开源合成孔径雷达数据集。
图2. 两步预训练过程。
Health AI健康云开放平台
专注于健康医疗垂直领域的AI技术开放平台
113
查看详情
在多个下游目标识别任务(包括小样本识别、稳健识别和目标检测)中,SARATR-X 1.0取得了国际先进或领先水平的性能。例如,在细粒度车辆MSTAR数据集上,其目标分类性能优于现有SSL方法,提升了4.5%。
图3. SARATR-X 1.0分类和检测结果。
图4. 在SARDet-100K上进行检测的可视化。
图5. 不同注意头的平均注意距离。
图6. SARATR-X在数据集大小、模型参数量和训练轮数方面的可扩展性。
团队已将SARATR-X 1.0的相关代码开源,并正在积极研发参数规模更大的SARATR-X 2.0模型,以及更多开源数据集,以进一步推动SAR目标识别技术的发展。
论文及代码链接: (此处请补充论文及代码链接,与原文保持一致)
以上就是首个公开发表的SAR图像目标识别基础模型!国防科大刘永祥&刘丽教授团队提出SARATR-X 1.0的详细内容,更多请关注其它相关文章!
# 国防科技大学
# 入门
# 编译后页面seo
# 全网营销网站长尾推广
# 菜鸟SEO建站
# 广告网站建设和推广
# 襄阳网站建设培训
# 深圳网站建设 企业
# 推广潮鞋图片素材库网站
# 昌邑网站推广平台有哪些
# 陕西seo排名最专业
# 辽宁seo营销加盟电话
# 内测
# 高质量
# 生命科学
# 多家
# 国防科技
# 日韩
# 多语言
# 一言
# 首个
# 开源
# 合成孔径雷达
# 目标识别
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
上新7款产品,美图继续“蹭”AI
当一切设备都受到人工智能的控制
无人机巡检方案是什么,该如何选择适合的巡检方案
微软向美国政府提供GPT大模型,如何保证安全性?
机智云AI离线语音识别模组,让家电变得更加智能便捷
第 66 届格莱美奖规定,AI 作品将无法获得评奖资格
650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了
【原创】奥比中光:与英伟达合作开发的3D开发套件正式发布 连接英伟达AI应用生态
电力人工智能数据集目录首次发布
厂商陆续公布AI进展 完美世界游戏展示复合应用AI in GamePlay
参议院司法听证会:AI 不易管控,有可能被恶意分子利用来研发生化武器
到中国科技馆体验“一滴油的奇妙旅行”,线上元宇宙展厅同步开启
小红书陷入麻烦!被指控未经许可使用用户图片进行AI训练
兆讯传媒率先全面拥抱AI 数智广告内容焕发新生机
马斯克回应人工智能拯救世界:人类已处于“半机器人”状态
小米发布CyberDog2 - 他们的第二代仿生四足机器人展示
AI取代人工先拿教育行业开刀?美版“作业帮”启动裁员
一句话搞定数据分析,浙大全新大模型数据助手,连搜集都省了
ChatGPT大更新!OpenAI奉上程序员大礼包:API新增杀手级能力还降价,新模型、四倍上下文都来了
优傲机器人的人机协作技术 助力中小企发展
马斯克WAIC2025演讲全文:AI将对人类文明产生深远影响
OpenAI宣布在伦敦设立海外分部,要招揽“世界级人才”
2025VR&AR显示技术峰会视频解析: 歌尔光学展示最新一代VR/AR光学模组
微盟宣布联合腾讯云共建行业大模型:加快激活AI大模型智能应用
国产工业机器人领域“暗潮涌动”,即将迎来新一轮复苏
AI大模型产品集体奔赴高考考场,教育赛道的讯飞星火能赢吗?
普林斯顿大学推出Infinigen AI模型 可生成真实自然环境 3D场景
鸿蒙生态带来了哪些新的流量可能性,包括AI、服务分发和原生智能等方面?
午报 | 字节跳动要造机器人;东方甄选首次启动自有APP|直播|
利好来了,AI再起一波?
阿里大文娱CTO郑勇:生成式AI将引发内容行业巨变,*制作机会挑战并存
人工智能:解决劳动力短缺的关键策略
央广车联网亮相2025世界人工智能大会
爱设计PPT发布第二代AI一键生成PPT产品:智能、个性化、自动化
此「错」并非真的错:从四篇经典论文入手,理解Transformer架构图「错」在何处
彭博社:苹果Vision Pro曾测试VR手柄追踪方案
智能机器人与话剧的完美结合:宇树四足机器人B1助力《骆驼祥子》重现经典
探展WAIC | 第四范式“式说”聚焦toB大模型,布局生成式AI重构企业软件
数据显示:人工智能相关专业热度上升最快 考古、美术、生物医学工程等小众专业火了
张朝阳陆川谈AI:大数据模型大幅提升工作效率,ChatGPT冲击最大的是内容创作领域
尼康尼克尔Z 180-600mm f/5.6-6.3 VR镜头发布:12499元 拍鸟神器
“可用”“有用”的讯飞星火认知大模型将亮相世界人工智能大会
Meta 人工智能业务落后竞争对手,研究人员大量离职成重要原因
618京东3C数码趋势产品备受青睐 AR设备成交额同比增长15倍
报告称 70% 程序员已使用各种 AI 工具编程
AI在教育中的角色:AI如何改变我们的学习方式
GPT-4是如何工作的?哈佛教授亲自讲授
Prompt解锁语音语言模型生成能力,SpeechGen实现语音翻译、修补多项任务
陈根教授:离人形机器人时代还有10年吗?
AYANEO AIR 1S 掌机 7 月 9 日发布:R7 7840U + OLED 屏