背景
在教育领域,人工智能和大模型技术的应用正逐步改变传统的教学模式,为教育教学带来新的机遇和挑战。目前,清华、北大、北航、南大、中科大等高校都已初步构建面向全校课程的AI助教系统。AI助教系统不仅能够提供24小时的个性化学习支持、智能评估和反馈,还能辅助学生进行深入思考,激发学习灵感,提高学习兴趣。
整体架构
- 高性能
-
· 300人并发/服务器
· 支持水平扩展
· 本地交付,可利旧
- 数据源
-
· 文档、图像
· 语音、视频
· 网站URL(自动爬取)
- 可定制
-
· 知识库参数
· AI助教参数
· 召回测试
- 统计分析
-
· 对话统计
· 性能监测
· 能力分析
统一入口
- 助教门户
- 两类助教:
提供统一的AI助教门户网站:
· 支持浏览查看所有AI助教。
· 支持按课程名搜索AI助教。
· 点击AI助教卡片,即可进入对话页面。
· RAG助教和Agent助教。
· RAG助教是基于知识库和检索增强生成技术构建的AI助教。
· Agent助教是基于大模型和智能体协同技术构建的AI助教
自建知识库
- 数据源
-
支持教师自建知识库,支持多种数据源:
· 上传本地文档,支持PDF、WORD、Markdown、TXT、XLS、CSV等常见文档格式,支持启用OCR识别文档内容。
· 从希冀教学平台同步,支持一键从希冀教学平台同步各类教学文档。
· 同步Web站点,自动爬取输入的Web站点所有网页数据。
- 可调参数
-
新建知识库时,支持教师自定义向量数据库参数(高级用法),包括:
· 分段标识符
· 分段最大长度
· 分段重叠长度
新建知识库时,支持教师自定义文本预处理规则参数:· 替换连续空格、换行符和制表符
· 删除所有URL
· 删除所有电子邮箱地址
- 索引方式
-
支持选择知识库文本的索引方式,提供如下3种索引方式:
· 高质量索引。调用系统默认的嵌入接口进行处理,以在用户查询时提供更高的准确度。
· 经济型索引。使用离线的向量引擎、关键词索引等方式,准确度有所降低。
· Q&A分段索引。
- 检索设置
-
支持选择知识库文本的检索方式,提供如下3种检索方式:
· 向量检索。通过生成查询嵌入并查询与其向量表示最相似的文本分段。
· 全文检索。使用离线的向量引擎、关键词索引等方式,准确度有所降低。
· 混合检索。
每种检索方式皆可以设置Rerank模型、Top K、Score阈值。
自建助教
-
· 提示词,通过提示词可定义AI助教的角色、回答问题的范围,可要求AI助教严格参考提供的文档回复,禁止自主发挥。
· 变量(高级用法)。支持引入变量,通过变量功能可通过表单或API编排需要变化的选项。
· 上下文,选择知识库,支持单选或多选。可设置召回方式,包括:N选1召回、多路召回。
· 开场白,开场白可拉近用户和AI助教的距离。例如,可将开场白设置为“我是《矿山安全》课程的AI助教,请向我提问任何课程相关问题。
· 问题建议,在回复完用户问题后,将自动生成若干个相关问题供用户选择,可自动引导用户进行下一步问答。
· 引用和归属,显示源文档和生成内容的归属部分。
· 内容审查,通过敏感词词库使模型输出更安全。
· 回复标注,支持让用户标注和评价回复质量,便于后续基于RLHF算法持续优化模型质量。
发布助教
-
AI助教发布后,可通过多种方式访问使用:
· 通过URL访问。发布AI助教后,将生成可公开访问的的URL,教师可将该URL转发给学生。
· 通过门户卡片访问。发布AI助教后,将在助教门户网页上显示相应卡片。点击卡片,即可进入对话页面。
· 通过API访问。发布AI助教后,将启动AI助教Restful API服务。第三方程序或应用可通过调用API访问AI助教服务。
· 支持将助教页面嵌入第三方网站中使用。支持通过iframe、浮动窗口(Window)、浏览器插件等方式嵌入到第三方网站中使用。
· 支持定制化修改AI助教页面(高级用法)。支持通过修改代码方式定制化修改AI助教页面。
使用分析
统计指标包括:全部消息数、活跃用户数、平均会话互动数、Token输出速度、用户满意度。支持按日志导出所有对话数据。