话说天下无大事,质变引潮流,在人工智能的江湖中,一切以实力说话。而被科技江湖津津乐道的未来第一武道赛AIWIN大赛在经历了风起云涌的三届之后,即将在万众瞩目之下正式启动第四届!回想前三届,多少科技新秀通过AIWIN展露头脚,各自在自身领域修得独到之处。又让多少科技后浪备受鼓舞,争相欲得新一届AIWIN头名,而这后浪不局限草木石菊,皆为黑马新星。
因此,2021届AIWIN为了选拔本土人才、打造本土门派、发现本土武功,特别联合江湖名门正派中国工商银行、海通证券股份有限公司、中国太平洋保险(集团)股份有限公司、国泰君安证券股份有限公司、上海东方传媒技术有限公司、上海市大数据股份有限公司、优刻得、上海白玉兰开源开放研究院、Datawhale、极视角以及百度飞桨等推出“剑”“气”两宗赛道,“剑”有形,形在项目;“气”无形,形随算法。“剑”“气”一体,方能吸人,人在,则智在;人盛,则能盛。何为“剑”,何为“气”,少侠请留意:
剑
“剑”道:应用创新赛 选评优质人工智能助力数字化转型的典型初创企业
“剑”需:B轮以下、5年内成立期内的初创形企业
“剑”胜:以城市数字化转型的三大板块:数字治理、数字经济和数字生活为应用创新的指定方向,征集有助于这三类场景实现数字化转型的人工智能解决方案或创新产品。
“剑”审:企业成长性 产品成熟性 技术原创性 商业落地性
“剑”得:荣誉证书 WAIC集中展区 闭门投资人对接 业务对接 媒体专项宣传
“剑”库传送门:www.aiwin.org.cn
气
“气”道:算法技术赛,原创性解决企业数字化升级场景下的算法技术痛点
“气”需:企业 高校中的算法开发者 爱好者 学习者
“气”胜:勇闯四大至高内功秘境
秘境1——互联网舆情企业风险事件的识别和预警
守关人:海通证券、工商银行
关卡溯源:近些年来,资本市场违约事件频发,财务造假、董事长被抓、股权质押爆仓、城投非标违约等负面事件屡屡出现。而在大数据和人工智能技术加持下,各种新兴的金融风险控制手段也正在高速发展,其中通过采集互联网上的企业舆情信息来挖掘潜在风险事件是一种较为有效的方式。但这些风险信息散落在互联网上的海量资讯中,若能从中及时识别出涉及企业的风险事件,并挖掘出潜在的风险特征,将使得银行、证券等金融机构在风险监控领域中更及时、全面和直观地掌握客户风险情况,大幅提升识别和揭示风险的能力。而风险事件以文本的形式存在,需要采用人工智能方法进行自然语言理解,实现风险事件的高精度智能识别。
关卡任务:从给定的互联网信息中提取、识别出企业主体名称,以及标记风险标签。
关卡传送门:http://ailab.aiwin.org.cn/competitions/48
关卡报团取暖团(秘境1闯关人集聚地):
秘境2——保险文本视觉认知问答竞赛
守关人:太平洋保险
关卡溯源:在寿险、产险、健康险等保险的理赔流程和客户服务环节中,存在大量扫描文档,例如医疗票据、费用清单、病例等。对这些扫描文档进行文字检测与识别,并且提取出结构化信息,可以用于极速理赔、个人健康管理等业务场景。
关卡任务:本次赛题将提供面向保险场景的扫描图片数据集,参赛队利用OCR技术自动识别影像资料后,再通过AI智能判断所识别文字的内在逻辑,回答关于图片的自然语言问题。问题的答案是可以从图片中提取的任何文本/标记。
输入:保险场景的扫描文档(例如:医疗票据)+ 自然语言提问(例如:病人服用的药品清单有什么?)
输出:对应自然语言提问的事实性答案
关卡传送门:http://ailab.aiwin.org.cn/competitions/49
关卡报团取暖团:(秘境2闯关人集聚地):
秘境3——文化传媒数字资产的自动编目
守关人:上海东方传媒技术有限公司
关卡溯源:传统电视新闻节目成片入库之前,需要人工对每条新闻拆条,再辅以人工理解添加语义标签、归类。冀希望基于计算机视觉、NLP和语音特征等多模态信息,自动将完整新闻节目时序解构、添加语义标签、并归类。
关卡任务:本次赛题将提供新闻节目视频集。参赛队对每期新闻节目,利用多模态技术,自动判断每条新闻开始、结束时间,智能添加每条新闻的4个语义标签,以及每条新闻的1个类别。
关卡传送门:http://ailab.aiwin.org.cn/competitions/51
关卡报团取暖团:(秘境3闯关人集聚地):
秘境4——机器学习在债券定价中的应用
守关人:国泰君安
关卡溯源:固定收益证券定价的驱动因素有五个层面,即基本面、政策面、供求面、资金面、情绪面。五个层面之间的相关性又很强,典型的是经济基本面与货币政策面之间的内生关系——央行依据经济基本面制定货币政策,货币政策的目的又是为了调节经济基本面。由于经济结构在变化、市场制度和参与者结构在变化、央行制定政策的依据和逻辑在变化、投资者的决策逻辑在变化、以及其他等等变化因素,固定收益的定价模型很明显也在变化中。影响债券价格的最重要因素是宏观因素,其最典型的数据频率是季度和月度,数据的相对低频导致定价逻辑中归纳的成分被缩小,演绎和博弈的成分被放大。以上因素导致目前市场中对于用量化方法研究固定收益证券并不看好。
计量方法在定价与预测中存在若干不足。第一由于经济与市场结构在变化,模型的结构也在发生变化,不同时期资产价格的驱动因素不同,在线性模型中这表现为模型系数的变化。举例说我国10年国债收益率,在2000年到08年间与CPI相关性很明显,之后这种相关性有所减弱。第二是解释变量之间相关性的问题,在计量模型中会导致有偏估计。想要尽可能多尝试一些新的数据构造解释变量,但不可避免地会陷入维度灾难。对于宏观因子,由于经济变量之间有千丝万缕的关系,相关性则会更高一些。滚动地使用Lasso或者使用动态系数模型或许有助于在计量经济方法范围内解决以上问题,但这已经削弱了模型可解释性。第三点是研究对象系统的非线性性质难以用计量模型挖掘。第四是难以确认计量模型的失效究竟是隐藏变量因素还是非线性关系因素。还有一些其他原因,但以上理由足以使得机器学习方法具有吸引力。
关卡任务:利用宏观数据、行情数据或者其它特色数据构建特征,进行机器学习建模,对中债10年期国债、中债10年期国开债、中债10年期AAA级地方政府债、中债10年期AAA级城投债以及中债10年期AAA级企业债到期收益率进行预测,预测给定的未来时间段(2021.5.6-2021.6.4期间,包含两端日期,共 23 个交易日)的系列十年期债券利率价格,并分析所用特征重要程度,给出相关逻辑解释。
关卡传送门:http://ailab.aiwin.org.cn/competitions/52
关卡报团取暖团:(秘境4闯关人集聚地):
“气”审:线上算法自动评分+线下答辩主观评分
“气”得:荣誉证书 现金奖励 企业校招 实习生绿色通道
万千武功终一脉,最是伯乐更难得。与往届一样,本届赛事也是亮点满满,细细道来清楚明了:
1.专项赛事奖金池:本次赛事为获奖团队合计提供48万赛事奖金。
2.紧密结合数字化转型主题:通过大赛比的是产品和技术,选的是企业和人才,为数字化转型赋能提供了全方位的要素。
3.创新赛事机制,联动产品和算法双轨:鼓励初创企业积极参加产品创新赛和算法技术赛,对于部分企业产品吻合产品赛评选范围且其人工智能技术对应算法赛赛题内容的,则通过大赛可对企业形成完整的从企业到产品再到技术的三层能力评估,从而实现更好地和数字化转型的需求龙头企业对接,强化赛事落地成效。
4.打造创新平台,活跃开源生态:围绕“赛题、数据、人才”实现资源聚合,首度开放来自企业的文本、视觉类训练集累计超过 200GB,4 万余条的标准标注数据,并通过联合合作伙伴如百度飞桨、白玉兰开源开放等,共同探讨建立人工智能算法创新的开源生态,以具备资源和技术的平台支撑常态化的算法创新。
5.“放眼世界,聚焦落地”:大赛除继续紧密联动英、法、以、德、意等国积极吸引海外初创型企业参与赛事,吸引落户中国。同时今年还将紧密联动北美高校驻华联盟等机构广泛触达世界范围内的算法人才,吸引参赛并回国就业。
英雄榜已贴,静候有缘人,即日起千里传音至AIWIN擂台 www.aiwin.org.cn 即可报名,
最新赛事资讯请持续关注世界人工智能创新大赛(AIWIN)官方飞鸽(微信 ID:aiworldin2018)。