中审网校更新 “站内问答” 模型,助力考前冲刺!
【站内问答】上线一个月以来,获得学员广泛好评,目前已成为学员复习中必不可少的工具。不过,此前的大模型中,偶尔会存在语言理解不到位,或对双重否认逻辑不清的情况,根据学员的使用反馈,网校的技术团队一直在进行模型调整,不断完善功能体验。
就在今天(2024年8月30日),网校上线新的 AI 语义大模型,助力学员考前冲刺!
根据技术团队测试,新模型的 AlignBench(对齐和遵循指令能力)还有 MATH(数学能力)均达到了非常高的水准,GPQA(小学问题)和 LCB(代码)这块则还有提升的空间,不过这两块对于 CIA 考试的辅导答疑作用比较小,不是技术团队的重点。
人工智能基准测试结果
OCRBench |
MME |
MMBench-V1.1-Avg |
MMStar |
MMVet |
MMMU-Val |
AI2D |
SEEDBench-IMG |
833 |
2274.7 |
82.4 |
62.5 |
69.9 |
53.3 |
83.6 |
77.4 |
MVBench |
LVBench |
时序问答 |
多轮对话 |
中英文支持 |
71.2 |
38.3 |
✔ |
✔ |
✔ |
数学逻辑测试:
语言逻辑测试:
欢迎各位学员使用和反馈,帮助网校继续提升。