首页 > 22届毕业的你,怎能错过字节跳动-搜索团队!
头像
字节跳动招聘官方账号
编辑于 2021-07-13 16:05
+ 关注

22届毕业的你,怎能错过字节跳动-搜索团队!

今年春节发布首支搜索年度短片中,抖音搜索月活用户已经突破5.5亿!

你是否好奇过:抖音用户每天上传千万量级的视频内容,在一个以推荐为主的社区内,抖音如何做视频内容的价值判断并给用户推荐更合适的搜索结果呢?
推荐VS搜索的内容价值判断差异:娱乐类视频易在推荐里获得大量关注和点赞,但对搜索来讲价值不高;而大量有价值的视频,无人问津。

基于传统的文本匹配相关性算法其实很难检索到抖音用户实际想搜索的内容。而抖音已凭靠着庞大的用户体量和Youtube索引量持平的视频资源,利用图神经网络算法搜索价值上的技术判断和突破,兼顾着“高流量”和“好内容”的抖音搜索已能满足大部分用户搜索场景的需求。用户在不经意间已建立了视频搜索的习惯,并且在抖音中的搜索需求和网页搜索需求逐渐一致。
抖音搜索近年发展史


抖音搜索快速发展突破的背后,究竟哪些优秀的团队在合作支持?

团队介绍

我们是谁?
字节跳动搜索团队
抖音搜索在搜索团队中的位置不可或缺,我们也同时是今日头条、西瓜、懂车帝等近10款备受欢迎的知名app强有力的“幕后支持者”,支持着字节跳动全线产品的搜索功能。
我们正在打造一个用户体验更加理想的全网搜索通用搜索引擎,成为“更懂你的搜索”!

我们可以给你什么?
搜索团队涵盖了推荐; 广告;NLP等各类算法和工程的应用和交叉,让我们有更多机会突破传统搜索引擎的天花板,提升用户真实的搜索体验;
日常工作面对的就是万亿级的数据规模,挑战大规模分布式存储和计算架构、NLP、CTR、ranking等世界难题,每一个改进工作都有可能带给数亿终端用户更直观的搜索体验;
基于庞大用户体量,规模效应和技术成长是显而易见的。
可以搞定搜索的你,其他场景都不必担心!

团队聚集了哪些同学?
字节跳动-搜索部门汇聚了大量行业顶尖产品和技术精英。有来自公司推荐/广告/后端等各方向的技术精英;有来自行业内被我们搜索业务所吸引的搜索技术骨干;也有无搜索经验却已快速成长为团队中流砥柱的扛把子。

抖音搜索的相关技术

自然语言处理算法

搜索是天然适合NLP大展拳脚的舞台,抖音App里大部分视频的文本不仅少而且还非常口语化。传统的基于文本匹配的相关性算***让大量的优质视频沉睡在数据库里,难以被检索到。为了解决这个抖音搜索相较于网页搜索劣势的问题,我们通过强语义多模态等方案来提高抖音搜索的相关性匹配能力。我们需要对海量资源有深层的语义理解。从基础的分词、NER,到应用上的意图识别、纠错改写、相关性等,每一个细节都是有趣又充满挑战的问题。

Leader有话说
在过去时间里,我们把BERT、多模态模型深度应用在搜索的各个场景,落地方面在业界处于领先水平。
但搜索的舞台很大,观众也不少,舞台上有老戏骨,也有小鲜肉。老戏骨带你成长,小鲜肉跟你一起成长。我们虽然突破了不少技术难题,但距离用户最理想的搜索引擎还有很长一段路要走,包括更加精确的语义理解、超大规模的NLP模型应用、视频级别的多模态、开源创新回馈社区等为了实现这一伟业,首先得有人才,希望能和大家一起把剧本演好,说不定还能把剧本改得更加精彩纷呈。
欢迎大家一起来做有挑战的事,提升上亿用户的搜索体验!

案例说明:语义相同但表达措辞很不一样的例子

推荐算法

搜索流量增长是搜索的核心目标之一,而推荐算法是搜索流量增长最为依仗的技术。打开抖音,点击右上角的搜索放大镜,就能看到我们为用户推荐的各式各样搜索词,背后的技术,是依托大规模机器学习模型构建的个性化推荐系统。这些推荐词既是用户个性化的,也参考了用户观看的视频信息,同时应用了多模态技术。我们的搜索推荐系统有业界规模首屈一指的候选集,每天服务数亿用户,技术深度深,业务重要度高,有广阔的应用空间和技术前景。

Leader有话说 (北大—5年搜索背景+5年推荐背景)
搜索中的推荐算法主要打造字节跳动的搜索品牌认知,负责搜索流量增长和搜索内容生态建设。
我们依托国内数亿日活用户的业务来打造业界前沿的搜索推荐系统。因业务丰富,加入我们的新同学也有很多机会来负责重要业务,是不可多得的成长机会。
业务上,抖音等产品的搜索发展势头迅猛,我相信未来也将是视频时代下搜索引擎的龙头,包罗万象,大有可为。
技术上,我们应用业界领先的推荐&NLP技术来处理超大量级的业务体量和数据,持续创新,前景广阔。

搜索基础技术

用户在使用搜索功能时,肯定希望得到的结果是匹配度和质量高且符合内心标准的,比如在抖音App中搜索“健康医疗”“社会新闻”等类型,用户希望得到结果来自知名且权威官方的信息渠道,则可信度更高,所以优化权威性,召回和排序结果是可以直接有效提升用户的搜索体验,快速找到心中那一份答案。

Leader有话说(机器学习—End2End—敢于扔掉技术历史包袱)
我们的引擎诞生于机器学习技术在NLP和推荐领域取得大幅突破的时代,没有历史包袱,所以从构建第一天起就选择了一条不同于传统搜索引擎厂商的技术路线。我们对ranking架构做有限分解,不像传统做法那样写很多人工规则,而是在召回、基础相关性、权威性、摘要等等搜索引擎的关键环节全部重度应用机器学习技术,end to end的建模和解决问题,使得我们能在极短的时间内就能在搜索体验层面做到业界领先。
这条路还远远没有走完,每天还能看到很多不能得到满意结果的用户查询请求,我们有很多新的idea因人力不够还没有精力去尝试探索,所以非常期待优秀的人才能够加入一起创新。
在这里我们的每个新人都有老司机来带着直接做线上很牛的项目,在实践中锻炼成长,优秀的人才能够快速脱颖而出。

架构

我们为抖音等App提供可靠,准确,满足用户内容检索需求的服务,在架构方向工作的同学涉及负责百亿级数据量规模网页,视频,图片检索系统的开发,优化和运维工作,从索引均衡,缓冲存储,日志管理,线上服务的方方面面都会涉及,在公司丰富运维工具和系统监控数据的帮助下,亲自处理每秒上万次的在线请求处理,这种在搜索庞大的系统中专注技术成长的机会不可多得。

Leader有话说(10年搜索老兵-爱钻研-灵活地胖子)
简单一句话形容我们:新人来了 mentor 带,方向灵活可自选,交流分享没边界,氛围轻松不内卷,工作时有板有眼,团建时推杯换盏
面对成千上万的在线服务 QPS ,需要你从容应对;离线数据去芜存菁,需要你仔细挑选。我们有小任务让你快速上手信心满满,更有大挑战完成之后充满成就感。去推动架构升级,解决系统风险,协助算法迭代,踩坑在所难免,不过没关系,踩了才知道水深浅。学习曲线可陡可缓,工作任务有繁有简,菜鸟能成为团队骨干,老司机也会遇到新挑战。
深入了解搜索核心技术,让系统每次都更快一点,服务质量越来越高,资源成本一减再减。 你能成长多少,只取决于你能看得多远。 背后有沉淀,面前有发展,这种团队建议你尽快加入,可以考虑一下,但千万不要太晚~


在字节跳动-搜索团队,你的每一次小小的策略细节优化亦是大型项目上线,都将形成指数级的影响,改变用户对于搜索的直观感受。加入我们,不仅仅是在抖音搜索中,在字节跳动近十款App中的搜索,都会有你努力过的痕迹。


投递详情
点击字节跳动校园招聘官网链接,直达“搜索团队”所有校招职位
【专属内推码】 83TADSP

趁年轻,和优秀的人做一件不断突破用户搜索体验挑战的事!
字节跳动搜索团队,期待你的加入!



全部评论

(4) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐