背景

在教育领域,人工智能和大模型技术的应用正逐步改变传统的教学模式,为教育教学带来新的机遇和挑战。目前,清华、北大、北航、南大、中科大等高校都已初步构建面向全校课程的AI助教系统。AI助教系统不仅能够提供24小时的个性化学习支持、智能评估和反馈,还能辅助学生进行深入思考,激发学习灵感,提高学习兴趣。

整体架构

高性能

· 300人并发/服务器

· 支持水平扩展

· 本地交付,可利旧

数据源

· 文档、图像

· 语音、视频

· 网站URL(自动爬取)

可定制

· 知识库参数

· AI助教参数

· 召回测试

统计分析

· 对话统计

· 性能监测

· 能力分析

统一入口

助教门户

提供统一的AI助教门户网站:

· 支持浏览查看所有AI助教。

· 支持按课程名搜索AI助教。

· 点击AI助教卡片,即可进入对话页面。

两类助教:

· RAG助教和Agent助教。

· RAG助教是基于知识库和检索增强生成技术构建的AI助教。

· Agent助教是基于大模型和智能体协同技术构建的AI助教

和基于知识库的RAG助教相比,Agent助教的最大优势是可以在真实环境中运行所生成的代码,并对代码自身及代码运行结果中的图文表进行详细的分析、说明和解读。

自建知识库

数据源
支持教师自建知识库,支持多种数据源:

· 上传本地文档,支持PDF、WORD、Markdown、TXT、XLS、CSV等常见文档格式,支持启用OCR识别文档内容。

· 从希冀教学平台同步,支持一键从希冀教学平台同步各类教学文档。

· 同步Web站点,自动爬取输入的Web站点所有网页数据。

可调参数
新建知识库时,支持教师自定义向量数据库参数(高级用法),包括:

· 分段标识符

· 分段最大长度

· 分段重叠长度

新建知识库时,支持教师自定义文本预处理规则参数:

· 替换连续空格、换行符和制表符

· 删除所有URL

· 删除所有电子邮箱地址

索引方式
支持选择知识库文本的索引方式,提供如下3种索引方式:

· 高质量索引。调用系统默认的嵌入接口进行处理,以在用户查询时提供更高的准确度。

· 经济型索引。使用离线的向量引擎、关键词索引等方式,准确度有所降低。

· Q&A分段索引。

检索设置
支持选择知识库文本的检索方式,提供如下3种检索方式:

· 向量检索。通过生成查询嵌入并查询与其向量表示最相似的文本分段。

· 全文检索。使用离线的向量引擎、关键词索引等方式,准确度有所降低。

· 混合检索。

每种检索方式皆可以设置Rerank模型、Top K、Score阈值。

自建助教

支持教师自建AI助教,提供丰富的定制功能选项:

· 提示词,通过提示词可定义AI助教的角色、回答问题的范围,可要求AI助教严格参考提供的文档回复,禁止自主发挥。

· 变量(高级用法)。支持引入变量,通过变量功能可通过表单或API编排需要变化的选项。

· 上下文,选择知识库,支持单选或多选。可设置召回方式,包括:N选1召回、多路召回。

· 开场白,开场白可拉近用户和AI助教的距离。例如,可将开场白设置为“我是《矿山安全》课程的AI助教,请向我提问任何课程相关问题。

· 问题建议,在回复完用户问题后,将自动生成若干个相关问题供用户选择,可自动引导用户进行下一步问答。

· 引用和归属,显示源文档和生成内容的归属部分。

· 内容审查,通过敏感词词库使模型输出更安全。

· 回复标注,支持让用户标注和评价回复质量,便于后续基于RLHF算法持续优化模型质量。

发布助教

AI助教发布后,可通过多种方式访问使用:

· 通过URL访问。发布AI助教后,将生成可公开访问的的URL,教师可将该URL转发给学生。

· 通过门户卡片访问。发布AI助教后,将在助教门户网页上显示相应卡片。点击卡片,即可进入对话页面。

· 通过API访问。发布AI助教后,将启动AI助教Restful API服务。第三方程序或应用可通过调用API访问AI助教服务。

· 支持将助教页面嵌入第三方网站中使用。支持通过iframe、浮动窗口(Window)、浏览器插件等方式嵌入到第三方网站中使用。

· 支持定制化修改AI助教页面(高级用法)。支持通过修改代码方式定制化修改AI助教页面。

使用分析

统计指标包括:全部消息数、活跃用户数、平均会话互动数、Token输出速度、用户满意度。支持按日志导出所有对话数据。

AI课程助教:RAG助教使用示例

AI课程助教:Agent助教使用示例

AI课程助教:支持在线出题

AI课程助教:支持在线出编程题

AI课程助教:支持在线判题

AI课程助教:知识图谱生成

AI课程助教:英语口语助教