4月23日,国内顶尖K12在线教育平台海风教育,在北京柏悦酒店举办了主题为“AI赋能·学习加分“的海风教育智学升级发布会。会上,海风教育正式对外宣布全新的品牌slogan——“科技驱动·因材施教”。同时,重磅推出了K12在线教育领域首个落地AI应用成果"好望角"。
中国人生科学学会名誉会长、国际青少年教育协会主席朱相远致辞
发布会现场,第九届、十届全国人大常委,第七届、第八届民主建国会中央副主席、北京市委主委,前北京市政协副主席朱相远出席并予以致辞,对海风教育“用科技和爱普及因材施教“的企业使命表示肯定。
朱相远曾任北京市科委副主任、北京市科学技术研究院副院长。现任中国人生科学学会名誉会长、国际青少年教育协会主席。对此次AI赋能,国内在线K12教育平台首个AI应用成果给予高度评价。
纵观国内在线K12教育领域,海风教育一直都担当创新与变革的领导者。截止2017年底,海风教育的注册用户已逾400万人,平台单日上课学员峰值近10万人,且新学员环比增长幅度超过50%,课程投诉率低于1%,各项数据均为国内在线K12教育平台中的领跑者。
前不久,海风教育就发布了两项最新研发成果:海风家委会App,实现了课堂透明化;海风智学派,则是当前国内市场屈指可数,同时支持pc、pad、phone端全平台的智能学习硬件。而今天,海风教育全新发布升级的海风智学中心,以AI技术为主导的多维情绪识别、专注度分析与课程质量分析系统——“好望角”, 创造性地填补国内K12在线教育领域的另一项空白。
海风教育创始人、CEO、首席班主任郑文丞
在智学升级发布会上,海风教育创始人、CEO、首席班主任郑文丞表示:“海风智学中心是海风教育自主研发的智能学习系统,历时四年、耗资过亿,持续研发升级而成。为了进一步发挥海风教育独创的“智能教学+真人教学”双引擎教学模式的优势,“好望角”AI系统蕴育而出,其独特之处,在于以下四个方面:
1、AI赋能,让每一位老师精确掌握孩子学习情绪和专注程度;
2、AI激励,让每一位孩子持续专注于课堂上的学习;
3、AI智能监督教师教学过程,让课堂更透明、让家长更放心;
4、AI智能分析每一堂课,持续输出课堂改进建议,实践因材施教。
面部表情是情绪最重要的表达方式之一。“好望角”AI系统通过精准的人脸识别,各类基于人脸表情分析的复杂工作将能够得到更细致地开展。众所周知,在K12在线教育领域,其实行业和用户的最大痛点在于:上课的时候,经过大量备课与准备的教师滔滔不绝地讲课,但学生却因没心情、没兴趣等因素,无法将这些知识完全接受。”而升级后的海风智学中心,老师可以充分利用“好望角”对学生面部表情进行情绪分析、对学生的眼球焦点进行分析,以此判断学生当前上课注意力情况,还能对学生、老师的语音进行转义分析,对其所说语义、语气进行判断。使老师本人更有成就感,也能让学生从中真正受益。
据郑文丞介绍,“海风智学中心是海风教育紧扣学生完整学习过程而独创,涵盖预习、上课、练习、复习、测评、方法建立、习惯养成、错误反思等功能,它将精准实现学生对学科知识点的闭环提升。”换言之,对课堂互动的综合情况,海风智学中心已经可以实现全景式解析。这一构建于AI技术之上的前沿教育理念,可谓与传统的线下教育机构内家长购买了类似黑盒的服务,却并不能够知悉在教学环节中究竟发生了什么有天壤之别。
2010年4月,郑文丞携手几位复旦精英创立海风教育以来,经历产品迭代与升级,从创立之初“足不出户·高效提分”,到今天正式对外宣布“科技驱动·因材施教“的全新品牌理念。海风教育一直都在践行”用科技和爱普及因材施教“的企业使命。
可以预见,"教育+AI"不仅可以解决教师与学生的时空错配、优质教师资源地域不平衡的问题,还能借此打造更多优质师资。 AI赋能中国教育事业的宏伟前景,也将因海风教育的全新布局,走向全新的时代!
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。