1月23日,2020 CCF大数据与计算智能大赛(简称CCF BDCI)决赛暨中国大数据技术大会在长沙落幕。作为全球大数据及人工智能领域算法、应用和系统挑战最具影响力的大型赛事之一,本届大赛共吸引了全球3万多支队伍参赛,提交作品8万余件。历经三个多月的激烈角逐,来自中科院深圳先进院多媒体研究中心(以下简称“SIAT-MMLAB”)的“随缘分割”团队在决赛中拿下“遥感影像地块分割”赛题冠军,并在64支获奖队伍中脱颖而出,荣获CCF BDCI综合特等奖。
此次大赛的“遥感影像地块分割”赛题要求参赛者使用相同数据,结合赛题场景自行设计算法思路、输出算法模型,呈现遥感影像地块分割模型在多个类别上的效果。参赛者不仅要考虑准确性,还要考虑水体类和道路类的连通性。由于数据集类别极度不均衡,建筑、道路和草地类总面积不到5%,而道路与水体分割又一直是遥感影像分割的难题,单纯依赖分割网络难以在分割区域的完整连续性上实现较好效果。因此,对道路、草地和水体类的处理是关键。
“随缘分割”团队借鉴自适应增强的思想,提出正负多阶段采样、类别针对性重采样等方法得到不同概率分布的训练数据,并用这些数据快速训练一批弱分类器,通过逐像素动态加权融合的方式得到强分类器。团队巧妙转换连通性问题为二分类问题,保证了道路和水体较好的连通性,并结合传统图像形态学处理,进一步增强了连通性,包括闭运算连接断裂处、中值滤波去毛刺、阈值筛选去除孤立像素团等。值得一提的是,团队设计了一种骨架连通性增强方案,对特殊类提取骨架并进行适当地膨胀腐蚀,在增强连通性的前提下保证连通区域不会过度超出原始预测区域,还根据数据的特性设计了一种动态优先级覆盖算法。最终方案可以得到鲁棒且平滑的预测,在赛道的A榜B榜都以较大的优势领先于第二名。