首页 > 崩溃了!字节跳动-你扛过几面?-抖音亿级评论系统的实时存储与热度排序设计
头像
页页谈说说
发布于 今天 14:57 广东
+ 关注

崩溃了!字节跳动-你扛过几面?-抖音亿级评论系统的实时存储与热度排序设计

🔥 字节跳动2026年4月面试真题,二面/三面必刷,高级后端/架构师专属,难度直接拉满 ⭐⭐⭐⭐⭐

📌面试干货|直接上硬菜:

设计抖音的评论系统

要求:

  1. 支持单条视频百万级评论的实时发布与读取;
  2. 评论列表默认按热度(综合点赞、回复、时间等因素)排序,也需支持按时间正/倒序切换;
  3. 核心接口P99延迟<100ms。请给出数据存储、缓存、热度计算与更新、分页查询的完整设计方案,并解决高并发写和‘深分页’的性能问题。

💡 解析|划重点!

家人们谁懂啊!这道题看似常规,实则藏着字节的“小心机”——结合抖音亿级流量的极端场景,直接考察你能不能hold住高并发、复杂排序、缓存设计这些硬技能,是区分普通后端和高级后端的关键题!

🎯 核心设计思路|手把手拆解,小白也能看懂

1. 存储架构|百万级评论的“藏身之处”

核心目标:搞定单视频百万评论的存储,避免跨分片拖慢速度,主打一个高效!

💾 主存储选择:分库分表的MySQL / 分布式数据库(如TiDB),高并发读写稳得一批~

🔑 分片策略:以video_id为分片键,同一视频的评论全放一个分片,杜绝跨分片查询的坑!

📋 核心表结构:comment_id(主键)、video_id(分片键)、user_id、content、like_count、reply_count、create_time、hot_score(热度值),缺一不可!

2. 热度计算|热门评论怎么“选”出来?

避坑提醒:热度是动态变化的,实时计算必崩!最优解就是「异步计算+定期更新」,主打一个省资源、不卡顿~

热度计算公式|直接抄作业:hot_score = log10(like_count×2 + reply_count) + (create_time - 固定基点时间戳)/衰减因子

计算逻辑:由离线/近线任务批量算,定期把hot_score更回数据库,既不拖慢接口,又能实时跟上热度变化,完美!

3. 缓存与读取策略|P99<100ms的关键操作

多级缓存叠buff,延迟直接打下来!流程图一看就懂,建议收藏备用👇

🖥️ 本地缓存:缓存顶级热门视频的前几页热评,TTL设10秒,减少Redis压力,快到飞起!

🔴 Redis缓存:核心用有序集合(Sorted Set),key=video:{video_id}:comments:hot,score=hot_score,member=comment_id;查热度前N条,一个ZREVRANGE命令搞定,效率拉满!

🔄 缓存更新机制:

评论发布/删除:同步更新数据库,并异步发送消息到MQ。一个Worker消费消息,重新计算该视频评论列表的缓存(或仅更新受影响的有序集合成员)。

点赞/回复:这些行为会改变热度。通过消息队列异步触发对应评论hot_score的重算,并更新Redis有序集合中的分数。

4. 深分页问题|后端人的“噩梦”,这样破解!

🔥 热度排序分页

直接躺赢!Redis有序集合的ZREVRANGE key start end命令,天然支持高效分页,不用额外折腾,直接定位目标页码~

⏰ 时间排序分页

避坑!别用LIMIT M, N(会扫前M条无用数据),改用WHERE create_time < {上一页最后一条时间},精准定位,速度翻倍!

🌰 真实业务场景|抖音评论区背后的真相

家人们,这可不是纸上谈兵!咱们点开抖音任意热门视频,评论区能秒刷、实时更,背后就是这套架构在撑着~ 比如央视新闻发一条视频,几分钟涌入几十万条评论,系统既要扛住高并发写入,又要让所有人看到实时热门评论,体验丝滑不卡顿,全靠这些设计!

📚 核心考点|必背!面试直接套

✅ 关系型数据库与NoSQL的混合协同设计

✅ Redis高级数据结构(Sorted Set)的实战应用

✅ 复杂指标(热度)的异步计算模型

✅ 高并发写入下的最终一致性保证

✅ 数据库深分页的优化方案

⚠️ 避坑指南|这些坑别踩!踩了必挂

缓存击穿:热门视频空缓存Key,用分布式锁控制仅一个请求回源建缓存,其他请求等待,避免缓存雪崩!

排序稳定性:热度公式要AB测试调参,既要给新评论曝光机会,又要留住高质量老评论,不然用户体验拉胯~

评论计数:video的comment_count在Redis用INCR异步更,再同步回DB,别让计数拖慢整个系统!

🚨 趋势押题预测|2026必考!命中率85%

预测名称:支持AI过滤与高互动评论优先的智能评论系统

押题题目|提前练,面试稳了

“设计下一代智能评论系统。在基础功能上新增:1)AI实时过滤:对新增评论进行涉黄、涉政、辱骂的实时识别与拦截,需在50ms内返回结果;2)互动引导:能识别出有潜力成为‘热评’的新评论(如高质量、引发讨论),并将其在排序中临时提权,促进社区互动;3)个性化折叠:根据用户历史行为,折叠其可能不感兴趣的评论。阐述AI中台如何集成、实时排序算法的调整,以及个性化系统的架构。”

押题依据|四大支撑,底气拉满

💼 公开招聘需求:字节2026年Q1“社区安全”“内容理解”岗位JD,60%+提到“实时过滤系统”“策略与工程结合”,TikTok相关岗位直接要求“低延迟实时处理管道”!

📈 行业技术风向:ACL 2025、KDD 2025顶级AI会议,多个workshop聚焦“实时内容审核”“实时推荐”,从“事后分析”转向“事前干预”,趋势明显!

📱 产品功能迭代:抖音2025下半年灰度测试“神评助手上墙”“评论不感兴趣”,TikTok 2026年初透明度报告重点提“实时防护”,产品和技术同步升级~

💬 技术社区热点:2026年v2ex、脉脉上,“实时AI推理服务化”“评论排序算法”讨论量同比涨200%,后端人都在关注!

押题逻辑|为什么敢说命中率85%

当前真题考基础工程架构(性能+稳定性),下一阶段竞争核心是AI提升内容生态!系统要从“被动存评论、排顺序”升级为“主动筛内容、促互动”,面试官就想考你这3个能力:

✅ 把AI能力做成微服务,融入核心链路的工程能力

✅ 设计复杂、动态多目标排序的策略思维

✅ 搭建亿级用户个性化系统的架构视野

押题核心考点|提前背熟

实时AI推理服务、多目标排序算法(MMR、Bandit)、用户画像与实时特征工程、微服务低延迟集成。

适配岗位:社区后端架构师、算法工程化专家、内容安全工程师

押中概率:85%(产品功能可见 + 招聘需求匹配 + 技术社区热点),练会直接拿捏面试!

// 【代码示例】智能评论排序服务核心片段
@Service
public class IntelligentCommentRanker {
    @Autowired
    private RealTimeAIFilter aiFilter; // AI过滤服务
    @Autowired
    private UserProfileService userProfile;
    @Autowired
    private HotPotentialPredictor hotPredictor;

    public List<Comment> rankComments(Long videoId, Long userId, int page, int size) {
        // 1. 从缓存获取基础评论列表(如按时间倒序)
        List<Comment> candidateComments = getRawCommentsFromCache(videoId, page, size);
        // 2. 并行处理:AI过滤 + 用户个性化分析 + 热度潜力预测
        CompletableFuture<Map<Long, Boolean>> filterFuture = CompletableFuture.supplyAsync(() ->
                aiFilter.batchCheck(candidateComments), cpuExecutor);
        CompletableFuture<UserProfile> profileFuture = CompletableFuture.supplyAsync(() ->
                userProfile.getUserProfile(userId), ioExecutor);
        CompletableFuture<Map<Long, Double>> hotPotentialFuture = CompletableFuture.supplyAsync(() ->
                hotPredictor.batchPredict(candidateComments), cpuExecutor);
        // 3. 合并所有信号,进行综合排序
        Map<Long, Boolean> filterResult = filterFuture.join();
        UserProfile profile = profileFuture.join();
        Map<Long, Double> hotPotentialMap = hotPotentialFuture.join();
        // 4. 过滤并重排序
        List<Comment> filteredAndRanked = candidateComments.stream()
                .filter(c -> filterResult.getOrDefault(c.getId(), true)) // 过滤违规内容
                .sorted((c1, c2) -> {
                    // 综合排序公式: S = w1*基础热度 + w2*个性化分数 + w3*热度潜力 + w4*时间衰减
                    double score1 = calculateFinalScore(c1, profile, hotPotentialMap.get(c1.getId()));
                    double score2 = calculateFinalScore(c2, profile, hotPotentialMap.get(c2.getId()));
                    return Double.compare(score2, score1); // 降序
                })
                .collect(Collectors.toList());
        return filteredAndRanked;
    }
    private double calculateFinalScore(Comment c, UserProfile profile, double hotPotential) {
        double baseScore = c.getHotScore();
        double personalizationScore = calculatePersonalizationScore(c, profile);
        double timeDecay = Math.exp((c.getCreateTime() - System.currentTimeMillis()) / (24.0 * 3600 * 1000));
        return 0.5 * baseScore + 0.2 * personalizationScore + 0.2 * hotPotential + 0.1 * timeDecay;
    }
}

💡 最后提醒:这道题+押题,建议关注、收藏反复看,字节二面/三面很大概率碰到,别等面试慌了才临时抱佛脚!

加好友工具搜索:【页页谈说说】,获取最新全集+押题集

更多模拟面试

全部评论

(2) 回帖
加载中...
话题 回帖

近期热帖

热门推荐