图片新闻AI攻克高考作文利用AI技术预测骨质疏松新研究用生物3D打印技术“打印”出微型肾脏南京江北新区半程马拉松全面启用5G技术
第12版:科技服务·AI
上一版 下一版  
图片新闻
AI攻克高考作文
利用AI技术预测骨质疏松
新研究用生物3D打印技术“打印”出微型肾脏
南京江北新区半程马拉松全面启用5G技术
     
 
重庆日报 | 重庆日报农村版 | 重庆科技报
重庆日报报业集团主办 
3上一篇  下一篇4  
2020 年 12 月 10 日 星期 放大 缩小 默认  

AI攻克高考作文

  见过AI下棋,可你见过AI写作文吗?

  前段时间,浙江高考满分作文《生活在树上》因为晦涩难懂的内容,刷爆了各种社交媒体。外行人看热闹,内行人看门道,大神们透过现象看本质。

  一般来说,高考作文可以通过批量化、模式化的训练达到一个令人满意的分数。实际上就是把学生当作一个写作机器进行训练,为学生输入大量范文,提供写作模式,然后进行长时间的学习。

  而这个过程同样可以用在对人工智能的训练当中。

  B站UP主(指在视频网络站、论坛、ftp站点上传视频音频文件的人)“图灵的猫”因此受到启发,一个人用3个月,500个小时,1万行代码,2亿条数据,17亿个参数,开发了一个会写作文的人工智能—— EssayKiller。

  EssayKiller的基本组成 

  一个 AI 不管外形和功能如何,其核心都是人工神经网络。EssayKiller 也是由三个不同的神经网络所组成。

  第一部分是类似于人类的视觉处理系统的识别网络。

  它通过外接摄像头的实时 OCR 以及卷积神经网络和汉字的识别与提取并将结果输入到下一层的网络中。

  第二部分是语言网络,旨在模范人类大脑的语言功能。在这里UP主将它分为两个子网络,相较于人类的颞叶区和额叶区等复杂构成,它更加简明扼要。一个子网络为读题网络,也就是对高考题目进行准确的阅读和主题摘要提取。

  另一个子网络为写作网络,也就是根据主题摘要进行文章的写作。后者是整个 AI 的核心,基于这个神经网络,EssayKiller 才能获得理解并输出汉字的能力。

  第三部分是判分网络。正常学生写完一篇800字的高考作文通常需要 40 分钟,而 EssayKiller 只需要 0.1 分钟。显然,在同样的时间里,EssayKiller 可以利用其快速写作的能力,在它的大脑中同时生成多篇作文,然后选出最好的一篇来作答。

  这个想法开发者借鉴了AlphaGo的设计理念。他利用API调用单独的神经网络,对 100 篇作文进行通顺度打分,取分数最高的一篇作文输出。理论上,只要了解于出题人的偏好,并且让 AI 完美拟合阅卷人喜欢的作文,就可以轻而易举地拿到高分。

  EssayKiller的学习过程

  三大网络神经搭建完成后,EssayKiller 就算是出生了。此时的它还是一张白纸,需要投喂大量数据养成。俗话说,读万卷书 AI 才能写出好作文。

  接下来就是 EssayKiller 的学习过程了。UP 主给它投喂了大量的优质散文、议论文,比如近现代散文集、历年高考作文等,然后让它自我训练并进行写作能力的提升。出于开发者的个人喜好,还为它增加了林语堂、木心、鲁迅等散文作家的作品,也加入了一些现代作家的,比如王小波、史铁生、王硕等。

  最后通过整理来的360万张图像数据、2 亿条中文预训练语料以及上千篇微调文章,成为了EssayKiller重要的学习素材。学习过程中,EssayKiller 的神经网络参数量已经达到了惊人的17亿,一般的显卡已经不能承受这么大的网络规模和计算量。在多次尝试,均属失败告终后,他终于发现,EssayKiller已经超越了目前市面上可见的任何一个单GPU的运算内存限制,增加了新的GPU后,学习才得以进行下去。

  经过137个小时的不间断学习,EssayKiller 终于成为一个合格的“高中生”,进入了测试阶段。

  测试时,开发者选择了两个全国卷和两个地区高考卷。EssayKiller 用它17 亿神经网络参数的多模块异构深度神经网络,通过开发者编写的高考格式排版脚本,搭配改装后的外接装置,对文本进行实时输出,在规定时间内将作文誊写到答题卡上。最终贡献了四篇语言是通顺的且能读懂的高考作文。

  除了高考,EssayKiller在其他应用场景上也有不少的潜力,比如撰写机关公文,因为有基础模板且没有文采要求,难度相对更小,且效果更好。

  (本报综合)

3上一篇  下一篇  
 
《重庆科技报》版权所有 未经书面授权 不得复制或建立镜像
地址:重庆市渝中区双钢路3号科协大厦 邮编:400013
技术支持:北京北大方正电子有限公司