“高中AI竞赛闪耀NeurIPS,中学生展示科研实力”
近日,备受瞩目的NeurIPS(神经信息处理系统会议)2024放榜,其中一则消息引人瞩目:人大附中的高中生吴悠,凭借其独立完成的论文《Vision-Braille:An End-to-End Tool for Chinese Braille Image-to-Text Translation》成功入选NeurIPS高中生赛道,并获得Spotlight Project的荣誉。
据悉,这是NeurIPS首次面向高中生征集论文,并专门设立了高中生赛道,旨在鼓励年轻学者在AI领域展示其创新力和研究潜力。吴悠的论文提出了一种中文盲文图像到文本的端到端翻译工具,展示了其在AI领域的研究成果。
该工具基于谷歌的mT5模型,通过Curriculum Learning(课程学习)方法对盲文翻译模型进行微调。论文作者克服了数据稀缺、盲文数据特殊性以及同音字混淆等难点,构建了包含“全音”盲文、无声调盲文和10%声调盲文的数据集,为模型的训练提供了丰富的数据支持。
值得一提的是,吴悠在2022年高一时便加入课题组,提出了这个项目的想法。经过两年多的努力,她最终完成了这一创新性的研究。
吴悠的项目Demo已经上线,感兴趣的同学可以访问https://vision-braille.com/进行测试。该项目不仅展示了吴悠在AI领域的才华,也为盲文翻译技术的发展提供了新的思路。
据悉,吴悠目前已进入康奈尔大学就读计算机和生物医药工程专业。她的论文在致谢中提到,主要是在导师张铭教授和袁野博士的指导下完成的。张铭教授是北京大学计算机学院教授,博士生导师,研究领域广泛,曾获得多项学术荣誉。
NeurIPS高中生赛道为年轻学者提供了一个展示自我的平台。该赛道要求提交的论文必须由高中生独立完成,并强调项目需具有积极的社会影响。其他顶级学术会议,如CVPR,也积极尝试与高中生合作,推广相关领域的知识。
吴悠的论文地址为https://arxiv.org/abs/2407.06048。