发展新质生产力,算法“奥林匹克”如何破题?
发布时间:2024年05月29日

我国人工智能发展已经驶入快车道。截至2023年年底,我国人工智能核心产业规模接近5800亿元,核心企业数量超过4400家,居全球第二。

人工智能领域的高速发展离不开算法技术的加速创新。作为人工智能的“三架马车”之一,算法是产业高质量发展的重要基础。对提升人工智能核心技术实力发挥着至关重要的作用。

近年来,广州琶洲发力算法产业建设,结合产业和区位优势,不断推出相关政策,组织活动,凝聚人才。今年5月,《广州市数字经济高质量发展规划》正式公布,其中提到,海珠区要进一步打响“琶洲算谷”品牌,举办广州·琶洲算法大赛,加快打造广州市人工智能大模型生态集聚和创新应用高地。

第三届琶洲算法大赛已经拉开帷幕,有什么新惊喜等待发现?



经典领域新突破


作为广州琶洲全国首创的重磅品牌活动之一,琶洲算法大赛至今已连续举办三届。

在今年的几大赛题中,中国人工智能学会联合GigaVision组委会提出了“十亿像素视觉智能”算法赛题——复杂场景长程轨迹预测(GigaTraj),受到各界关注。GigaVision挑战赛是全球首个针对大场景、多对象及复杂关系问题的智能算法比赛,其去年的比赛吸引了全球超过1000支队伍参与。

据了解,本次赛题的素材来自清华大学成像与智能技术实验室的研究成果——非结构光场成像装备(Unstructured Camera Array)。该研究攻克了宽视场与高分辨的矛盾,具备十亿像素级的成像能力。基于该成像装备,GigaVision团队构建了国际首个具有大场景、多对象、复杂关系数据平台PANDA,旨在推动新一代人工智能理论与方法的变革。


(PANDA数据平台中的代表性场景——云南泼水节。4万平方米场景中,千余名行人存在复杂的群组和交互关系。)


本届GigaVision赛题基于PANDA数据集,为选手提供了复杂大场景的宽视场高分辨图像序列(单帧涵盖约4万平方米场景,达十亿像素级)和长时程行人轨迹(像素坐标与真实世界坐标,30秒/60帧)。要求参赛者根据给定数据,完成针对百余名行人的长程轨迹预测(30秒/60帧)。



(GigaTraj挑战赛的场景缩略图。均为4万平方米大场景,平均单帧行人数量超300名。)


作为全球首个针对大场景、多对象及复杂关系问题的智能算法比赛,GigaVision可以说是人工智能视觉算法领域的“试金石”。相较于其他计算机视觉算法比赛,这一比赛存在诸多与众不同之处。

轨迹预测是计算机视觉领域的经典问题。但受限于传统成像设备的局限性,现有轨迹预测研究缺少同时兼顾宽视场和高分辨的数据。如果图像的分辨率不够高,研究者只可根据行人的历史运行轨迹进行分析。而由现有成像技术已突破十亿像素级感知通量,兼顾宽视场和高分辨,因此构建的数据集包含了更多的信息。因此,参赛者能利用的信息包括但不限于:长程轨迹、运动姿势以及人与人、人与环境的交互行为等。

“场景中有海量信息可被挖掘。换言之,我们欢迎各个水平的人都参与进来。”GigaVision挑战赛赛题评委表示,面向具有大场景、多对象、复杂关系特点的十亿像素视频数据,现有视觉智能算法面临超高数据通量与信息量带来的诸多挑战。

参赛者“各显神通”,评委会如何给参赛算法“打分”?“首先最重要的肯定是看性能指标。”GigaVision组委会表示,用更少的信息实现更精准的轨迹预测、更巧妙地挖掘图像中的语义辅助轨迹预测、使算法可以泛化到不同场景下,这些都是赛题评判时会考虑的问题。

“我们的最终愿景是成为算法领域的‘奥林匹克’。”GigaVision组委会告诉21世纪经济报道记者,团队希望通过比赛打造一个新一代人工智能算法权威榜单。“就像奥运会一样,大家想知道哪个算法更优秀,就可以通过在GigaVision排行榜来判断。”



传统行业新场景


人工智能风起,算法在经济发展中的地位日益凸显。

近年来,面对新一轮科技革命和产业变革浪潮,琶洲把握机遇、乘势而上,率先建设人工智能大模型应用示范区,推动“琶洲算谷”勇立潮头。 “琶洲对算法产业的发展非常重视,这是我们选择与琶洲一起打造赛题的原因。”GigaVision组委会指出。

在与琶洲展开合作之前,GigaVision已经联合国际人工智能顶会(CVPR、ICCV、ECCV、ACM MM等)举办了多届十亿像素视觉智能比赛。当被问及本次选择与琶洲算法大赛合作的原因,GigaVision组委会解释道:“十亿像素视觉智能事实上还有突破的空间。我们每年都举办比赛,就是希望鼓励相关领域研究者追求更高、更快、更强。”在组委会看来,这是一个不断解决问题,最终跑出颠覆性技术的过程。“所以今年我们也希望在这一赛题上,与琶洲算法大赛强强联合,碰撞出新的火花。”

据组委会方面透露,相较于GigaVision往届的赛题,在今年的琶洲算法大赛中,有不少高质量场景首次亮相。比如,出题方提供了一段云南泼水节场景,让参赛者进行分析。在文化层面,赛题能够凸显民族特色;在技术层面,泼水节人流量大、行动轨迹复杂,也能保证赛题的难度。

人工智能技术的产业发展都在不断加速,算法、算力、数据作为技术基础的重要性不断得到提升。

2023年12月召开的中央经济工作会议提到, 要以科技创新推动产业创新,特别是以颠覆性技术和前沿技术催生新产业、新模式、新动能,发展新质生产力。今年《政府工作报告》也将加快发展新质生产力列为2024年的重点任务。

走向千行百业、赋能生产生活的人工智能技术是新质生产力的最好代表之一。

“人工智能技术革命可以与蒸汽机带来的工业革命相提并论,AI最终会进入所有行业,并大幅提升劳动生产率。”此前,欧洲科学院外籍院士、国际人工智能联合会理事会主席、南京大学教授周志华在第三届琶洲算法大赛启动大会上指出。

在GigaVision挑战赛赛题评委看来,参与GigaVision赛道角逐的角逐的赛题如果足够优秀,将能够引领产业变革。

制造业有望通过与相关算法的结合更进一步。《广东省制造业数字化转型实施方案(2021—2025年)》发出了全面推进制造业数字化转型号召,其中就提到,要发展高端装备制造产业集群支持整机及核心零部件企业建设数字化、智能化、无人化车间。

“比如,在制造园区的无人场景下,机器人等设备提供服务时,需要一个中枢大脑对其发布指令。这时,优秀的视觉算法和高素质的相机能够保证决策中枢‘心明眼亮’,高效决策。”GigaVision挑战赛赛题评委指出。

在制造业之外,复杂场景的轨迹预测算法在公共安全、智慧城市等领域都已经投入应用。在以前,如果只用多个小的摄像头,对火车站、商圈等人流密集场景进行监测,则容易面临跨相机跟踪的难题。如果使用宽视场高分辨成像装备,则有利于实现平方公里级大场景精确监测,提供有效的安全保障。在智慧城市方面也同理,只有详细掌握轨迹,才能保证在调度规划上后续的有效响应。

GigaVision组委会告诉记者,往年赛题中,有部分表现优异的算法已经走向应用。GigaVision组委会也希望能够通过与琶洲合作共同突破大场景长程轨迹预测领域的技术极限,激发市场价值。


AI强区新方向


近年来,海珠区紧紧扣住“算法、算力、数据”人工智能三大支柱,全力以赴推进“琶洲算谷”建设,实施了“组建一个算法产业联盟,出台一份促进措施,举办一场算法国际大赛,建设一个算法产业中心,集聚一批算法项目,认定一批算法产业基地,凝聚一批算法产业人才,拓展一批算法应用场景”的“八个一”举措。

据悉,百度、商汤、科大讯飞等AI强势企业都加入了琶洲算法产业联盟。而琶洲领军算法师的入选人除了来自前述“大厂”,还有来自树根互联、技象科技、云蝶科技等琶洲企业的算法人才获评。

在今年“人工智能+”的号召下,AI如何应用到各行各业成为产业发展的重要问题。

为支持相关产业高质量发展,海珠区重点构建了政策助力、算力供给、合规指导、孵化培育、金融赋能、生态集聚六大平台,打造大模型发展最好生态,推动大模型产业集群成势。

在政策方面,海珠发布《广州市海珠区建设人工智能大模型应用示范区实施细则(征求意见稿)》,争取以政策为激励,撬动大模型千亿级产业集群。

在算力方面, 打造算力供给平台,全力夯实大模型算力底座建设,打造绿色、稳定、适配全球大模型的智算中心,统筹构建算力调度平台,目前已推动琶洲算谷系列智算中心建成200P本地算力,通过异构算力服务,全力助力大模型企业调优、应用。

而在合规指导方面,琶洲人工智能大模型合规指导服务中心,围绕大模型和算法备案,向企业提供备案咨询、辅导培训等服务,推动大模型技术的合规化、规模化应用,今年以来已引导完成大模型备案3个,算法备案15个。

据悉,目前海珠区已进驻行业大模型近40个,集聚泛人工智能企业近2000家,2023年贡献营收近900亿元,同比增长21.3%,已初步形成龙头引领、腰部支撑、中小企业集聚的“热带雨林式”产业生态,带动海珠信息传输、软件和信息技术服务业连续3年实现两位数增长,占海珠区GDP比重达到15.4%。

第三届琶洲算法大赛,邀请参赛个人、机构和企业拿出最成熟的产品、最先进的算法参与切磋,推动人工智能技术提升和落地转化。海珠将以算法为抓手,持续发展人工智能产业,赋能新质生产力发展。


扫码点击进入官网报名