/ 注册

去牛客

首页 > 攒人品：小米大模型算法面经

牛客310281160号

发布于 12-23 15:28 江苏

+ 关注

攒人品：小米大模型算法面经

flash attention解释下
gqa解释下
怎么才能训练好一个sft过程？
sft的loss计算是用什么计算的？
lora原理
lora参数权重初始化
lora的r和缩放参数
dpo的loss
dpo数据集怎么构造比较好？
如果dpo训练过程中，accept回答和reject回答的loss都在升高，怎么办？
假如说dpo效果不好，怎么解决？
多轮对话一般要怎么训练？
rag的流程？
检索时，只用关键字匹配会存在问题，怎么具体解决？（没有上下文语义信息）
给定一个网页，如何提取其中的关键信息

2026最新求职资料大礼包领取

大家都在关注

校招日程表笔试日历 ai模拟面试面试宝典剑指offer 知识点专项练习

全部评论

(2) 回帖

加载中...

话题同步到我的动态回帖

博文推荐

近期热帖

26届双非本鼠硕拿下5个ssp的秋招总结及一条龙经验分享

回复(18) 发表于 12-22 16:44
选择即命运—2025年度总结

回复(17) 发表于 12-23 20:16
从H200解禁评估：国资算力平台还值得应届就业吗？

回复(13) 发表于 12-23 14:50
【25年终总结】-牛客运营团队

回复(51) 发表于 12-22 19:22
大二混子终于找到实习了...

回复(59) 发表于 12-22 11:30

热门推荐

扫描二维码，关注牛客
意见反馈
下载牛客APP，随时随地刷题

牛客竞赛，专业的竞技算法训练平台: 扫描二维码，进入QQ群



扫码关注“比赛自动姬”

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号