芥末堆 吉吉 11月14日报道
11月14日,在以“共建丨让更好的教育来得更快”为主题的GET2017教育科技大会上,猿辅导联合创始人李鑫分享了小猿搜题上线三年,猿辅导在这一产品线上的思考与决策,李鑫表示,三年的时间,小猿搜题已成为中小学生入口级产品。
他透露,猿辅导在4年前建了一个AI的团队,而小猿搜题也是这个团队贡献的第一个产品,“我们这款产品有很多的用户,在这样的情况下,大量的数据对AI产生更强劲的影响。”
“我主要讲的其实是我们这3年做了哪几件事情,其实总结来讲有三个阶段,第一阶段工具,第二阶段内容、第三阶段我们要开始做学习这件事情。”李鑫说。
李鑫希望,学生从一个不会做题的入口进来,通过他们的内容与产品能彻底解决这道题不会做的背后存在问题,完成一个学习的闭环,智能学习引擎是他们今年在做的事。
以下是李鑫演讲实录(芥末堆略有删减):
感谢芥末堆和初九的邀请,来之前我看了一下议程,发现这个议程有三天,我就震惊了。要么就是芥末堆太火了,要么就是教育行业太火了。
很高兴有机会跟大家交流,我也想了一下,刚初九也讲了,我们其实是很少在公开场合讲,倒不是说,我们有什么不愿意的,是我们确实觉得现在还是一个非常早期的阶段,其实很多东西也是我们在摸索当中,我们觉得公开去讲,不知道是好事还是坏事,但是今天来了,刚好我们又想这个时间点正好是我们公司的产品小猿搜题上线三周年的时间点,我想我们借这个机会给大家分享一下我们在这个产品线上的产品决策、思考。
小猿搜题已成为中小学生入口级产品
这是我们公司的一些产品,这个是K12的板块,我们最早是做了猿题库产品,猿题库产品是一个学习的练习系统,学生可以通过猿题库去做大量的练习,因为我们之前觉得中国的学生在做题和练习这个环节投入时间比较大,我们希望能够通过科技的手段去帮助他们在练习过程当中提高效率。
接下来第二年,也就是2014年,我们上线了小猿搜题这个产品。这是一个拍照答疑的产品,简单来讲,如果遇到不会做的题,用这个拍照是可以告诉你这道题应该怎么做。
猿辅导是我们刚刚上线一两年的产品,这是一个在线辅导的产品,因为过去我们在一些产品和数据上的积累,我们觉得可以给学生提供一些对接老师和学生的服务,所以我们做了这么一个产品。
后面两个产品也是我们刚刚上线几个月的新产品,可能是针对年纪更轻的一些小孩使用。
小猿搜题这三周年确实可以总结一些我们在过程当中的一些思考。其实现在看来这个产品,我们觉得拍照搜题这个产品确确实实已经成为学生的入口产品。
我们刚开始做这个产品的时候,很多人在问,未来这个产品会成为一个入口吗?其实当时我们也不确定,我们觉得拍照搜题是解决学生答疑的问题,我们觉得答疑的需求量应该是很大的,在各个体系里面都可能会,不管在什么样的学习系统里面,都可能会有答疑的需求。
如果能够把额个产品做好,我们觉得他可能会成为一个用户量很大的产品,但是我们也没有觉得它是一个入口。 现在之所以说它是一个入口,因为我们看到拍题量很大,用户量也很大,数据当然没有太大的意义,我只是说,它的使用场景现在是一个普遍性的使用场景,在教育行业,如果找到一个使用人数非常多的产品,其实是不太容易的,它需要一个很强的需求,而且你要认可它。所以,我们觉得现在这个产品是这么一个阶段。
人工智能在学生学习场景下的实际应用
我们看到有很多教育公司都会谈AI,我们公司在4年前建了一个AI的团队,小猿搜题是我们这个团队贡献的第一个产品,很幸运,我们这个产品拿到了很多的用户,在这样的情况下,大量的数据对AI产生更强劲的影响。
比如说举了个例子,我去统计了一下我们的数据,大家知道最一开始拍题的场景,用户他是有练习册,或者学校是发一份试卷、作业,它是印刷体,所以他拍照上来,然后我们去识别它。后来我们就发现,其实很多的学生,不知道场景是什么样的场景,可能他是做笔记或者其它的,或者拍的错题本,很多的题目是手写的,我们看了这个系统里面,差不多每天用50-60万条手写的题目在拍照上传。
但是,我们机器学习的团队一直在适应这样的一个手写,我们的手写识别率是非常高的,而且数据量非常大,因为这个它要依赖大量的数据,所以其实我们也看到很多公司,比如说在研究手写笔或者其它相关的产品,它其实是想识别学生的笔记,但其实我们这个量是很大的。所以,在后续的时候,如果对学生的判卷做了很多的事情,其实都是在依赖于这个数据。
我们上面有一个功能叫“英语作文的批改”,如果他写了篇英语的作文,他是可以直接拍照来批改的,写英语作文也是手写的,我们每天上传的这个数据也是几万篇的数据。
所以,我们在手写识别领域,即使放到整个的互联网行业应该也是最领先的,因为没有人有我们这样大量的数据和场景应用。因为,很多印刷的应用可能很多公司是有很多的数据,但是大量手写的这个场景其实非常少的。
包括英语我们批改,我们最近马上要发的一个版本,大家都知道拍照有一个叫美图秀秀的软件,就是你拍完了之后就可以美化一下,我们之前的批改是你给你评分,告诉你哪些句子、单词、语法错了,我们会把它列出来,接下来我们有一个功能(我们基于大量好的作文学习之后,我们有一个功能内部叫一键美化),就是你英文作文写了一篇之后,其实写的不太好,但是你点这个按纽,可能我们就很快就会帮你优化下,觉得在哪个句子上你可以替换成一个什么样的句子会让你有更高的分数,同时会告诉你为什么要这样做。
这个都是一些场景的应用,我们也有一个古诗文的助手,这个主要是学生会背诗、背一些古文,因为高考、中考都会考一些相关的内容,所以,很多的学生会通过这个练习,我们用他的数据来做训练,所以会提供一个更好的产品。但是,这些应用其实在产品的层面还是刚刚开始。
三年,从工具到学习引擎
我主要讲的其实是我们这3年我们做了哪几个事情,其实总结来讲有三个阶段,我的标题叫《从工具到学习引擎》,第一阶段工具,第二阶段内容,第三阶段我们要开始做学习这件事情。
>>工具
既然它是一个工具,如何在学生拍了题之后,准确的帮他识别,然后找到他想要的信息,所以我们第一个阶段其实重点是在做识别率。最开始整个行业的识别率都不高,我印象当中我们上线的时候是60%左右,到后面接近95%,这是我们一直在提升的阶段,这个阶段其实也是我们的用户增长非常快的一个阶段。
但是,在这个阶段(2015年)整个行业和社会上都在讨论一个问题,其实到现在为止我认为很多没有用过产品只是听说过的人,他可能都会有一个疑问:你的产品小孩会用来抄作业吗?
从我们这个角度肯定不是这样的一个设想,如果是这样设想这个产品是没有什么价值的,但是当时大家有这样的一个分歧如下:
一个产品它在传播的过程当中,大家可能会挑实现功能最强的那个点,大家会认为马上会出来答案,所以这个东西很神奇,它会发生自然的传播。
其实我觉得当时的互联网教育也刚刚开始,整个行业我感觉也不是思考地很清,我看了也有很多同类的产品,会在广告、推广当中会提到,用了这个产品作业写得很快。甚至我们看到,也有当时做得好的拍照搜题还提供了一些额外的产品入口,比如说拍寒假作业的封面,就可以出这本书的答案,我觉得这都是一些产品带来的思考。
但是,我们在这个过程当中坚持的定位是我们一定是做学习答疑,我们觉得答疑是一个100%的需求(所有学生都会有的需求),但是抄作业肯定不是每个学生的需求,只是很少部分学生的需求,那我们肯定要做一个确定性更大的,而且价值更高这个事情,所以我们坚持在这个定位上。
后来,事实上我们在一些产品的决策上,验证了我们的观点,而且对我们来讲是很开心的一件事情。
>>内容
用户拍了题之后,我们给他提供答案,有的我们也提供详细的解析,但是都是文字版的,我们觉得互联网比其它有优势的地方就是你可以承载更多的内容,所以我们想,如果学生能精准地拍到一道题,我们给他提供这个题的视频讲解,我们想对学生来讲应该是更好的,然后我们就做了。
我们花了6个月时间做了30万条视频,这个筛选我们肯定是按频率(学生搜索率),所以它是一个数据下的筛选,也就是这30万条视频的覆盖率,我印象中能覆盖到20%-30%的搜索量,也就是20%-30%的搜索量都能搜到有视频讲解的这个版本,这个我们在行业里面没有人这么去做,我们先做了。
>>学习
我们坚持是学生是用来学习的。有一个数据是55%。我们当时上线之后,我们去看每一个学生搜到一道题之后,他有没有去点老师讲这道题的视频,我们发现每天用户当中有55%,只要有视频的题,他都会去点个播放,而且完成率是百分之七八十。
当时我们看了这个数据之后,我们就更加确定这个产品的未来应该是解决学生学习的场景,然后去帮助他们做答疑。所以,我们在思考一个事情,因为,学生在用小猿搜题拍一道题目的时候,他到底想得到什么,我们很多的时候会觉得,最简单的就是他想知道这道题到底是怎么做的,我们认为这个是表面的需求。
深层次地来讲,用户为什么会用小猿搜题?我们前面已经排除掉,他肯定不是来抄答案的,因为抄答案成本太高了,因为我们的平台上他要一道道去拍,他通过其它的渠道抄答案应该会更简单一些。
他的大量场景,要在没有老师、没有特定的人帮他解决问题的情况下,他遇到不会做的题的时候,应该怎么办?
其实做作业是一个检测手段,他如果在这个学习过程中不会做了,那就是出现了信号,这个信号进来,你应该怎么办?我们应该先帮他解决这道题应该怎么做,因为我们有大量的数据,我们会希望看到怎么能够通过这道题去解决他背后的问题,很有可能这道题不会做是有原因的,可能是某一个知识点、结构、概念没有理解到。
所以,我们就通过这个题往下再做一个导入,我们做了大量的切片式视频,相关知识点的,或者相关提醒的。因为他这道题不会,让他先知道这道题怎么做,然后再进一步地看一些名师提供的一些关于你这道题不会做背后的原因,再帮你去检查这个原因。
完了之后他再通过我们的练习(通过算法给他一个类似的题目),再看他是不是会做了,如果会做了,我们认为这是完成了一个学习的闭环,其实这个是我们今年做的一个事情,我们希望他从一个不会做题的入口进来,然后通过这样的一个产品彻底解决他的问题,我觉得这是一个非常天然的场景,就是希望他从不会然后到彻底掌握。
其实,在做了这个事情了之后,我们也在思考,当学生遇到问题的时候,他在各种场景下,比如说学校做作业,或者上辅导班、猿辅导、学而思,他只要在任何的场景下,遇到学习的困难,我们都有一个24小时的帮手能够帮他解决这个问题,我觉得这是一个非常好的互联网场景。
最后我提一个疑问,我看前一段时间有人在讨论AI能替代老师吗?但是我觉得这个问题和前面几年,大家讨论在线教育到底对传统教育有没有可能颠覆是一样的,其实我觉得这个问题是没有太大意义的,但是我们刚才构造这个场景我们觉得能够非常大地去节省老师的时间,你想这个时候我们批改作文,我们一秒钟就可以帮你批改,所以很多的老师不用在这个上面花时间的,答疑也是一样的。
我们现在每天去播我们的视频也是几十万人,如果他旁边有一个人帮他讲解,我们相信这个能帮他们提高很大的效率,我觉得整个教育,不管技术,还是AI,还是新的技术出来以后,我觉得核心是怎么去提高原来的驾驭、学习的效率,我们其实只有做增值的部分,才能产生价值,谢谢!