经授权转自知乎:https://zhuanlan.zhihu.com/p/616825763
0. Readme
关于组内简单介绍:Clickhouse深度改造,产品有火山引擎上的ByteHouse,开源的是Byconity
https://github.com/ByConity/ByConitygithub.com/ByConity/ByConity
大部门还在招聘的岗位有:
- OLAP引擎研发工程师(包括Clickhouse研发、Doris研发)
- 后端研发技术专家/工程师-火山引擎分析型数据库
- 系统开发/算法工程师-AI for DB/System
- LakeHouse 公有云技术专家
- 数据湖存储专家-Hudi
- 数据湖 高级工程师/技术专家
- 向量化计算引擎技术专家/架构师
- …
部门还有一些急招/社招岗位,感兴趣的同学可以找我内推
简历发送至邮箱: [zhoubintao@bytedance.com](mailto:zhoubintao@bytedance.com)
说明:
- 认真对待每一份简历,免费提供咨询、简历修改与内推服务
- 对候选人负责,只推自己所在的数据平台部门,只推数据库以及相关岗位
- 收到简历后,24小时内会回复邮件
- 对不了解的岗位不内推
1. OLAP引擎研发工程师-火山引擎(北/上/杭)急招 · 社招
职位描述
1、负责分布式数据库(云原生架构)设计实现,打造业界领先的数据库系统;
2、理解业务/云原生架构,从场景出发,设计并实现高并发,低延时,高容错系统;
3、分析系统性能瓶颈,从软硬一体设计出发,打造极致系统;
4、跟踪数据库前沿技术,挖掘/落地新技术的机会,包括新硬件,智能优化器,湖仓一体等。
职位要求
1、熟悉分布式算法和系统,有数据库内核或者分布式系统研发经验优先;
2、熟练使用C/C++/Golang等语言的其中一项,有企业级产品研发经验;
3、扎实的计算机基础知识,包含数据结构,算法,多线程编程,I/O,操作系统调度等;
4、熟悉一款数据库系统或一个模块,例如K/V,ClickHouse, Greenplum, MySQL, Doris等;
5、具备较强的自驱能力,擅长解决难题,善于沟通和团队协作。
2. 数据库内核专家-OLAP引擎 急招(Clickhouse) 北/上/杭 · 社招
职位描述
1、打造业界领先的 PB 级 OLAP 引擎,并支撑字节跳动几乎所有产品线(如抖音、今日头条等)交互式分析;
2、优化OLAP引擎内核,构建面向海量数据的下一代弹性分析引擎;
3、主导引擎相关的设计、实现、 测试、优化、集成等工作。
职位要求
1、熟练掌握 C++ 及相关调试方法,主流的数据结构和算法;
2、了解数据库/分析引擎模块,熟悉大数据系统相关原理;
3、有大数据/数据库相关领域的开发经验,包括但不限于存储引擎、执行,SQL 解析、优化分布式调度等;
4、有Cloud/新硬件/数据库集成有相关经验优先;
5、具有良好的团队协作能力、团队管理能力。
3. 数据库内核专家-OLAP引擎(Doris方向) 北/上/杭 · 社招
职位描述
1、打造业界领先的Doris服务,在实时数仓、在线报表等场景服务字节跳动核心业务;
2、结合业务场景特点,设计并实现高并发、低延时、高容错系统;
3、参与开源社区建设,回馈内核优化,打造优秀的开源口碑。
职位要求
1、熟悉分布式算法和系统,有数据库内核或者分布式系统研发经验优先;
2、熟练使用C/C++/Java等语言的其中一项,有企业级产品研发经验;
3、扎实的计算机基础知识,包含数据结构,算法,多线程编程,I/O,操作系统调度等;
4、熟悉一款数据库系统或一个模块,例如K/V,ClickHouse, Greenplum, MySQL, Doris等;
5、具备较强的自驱能力,擅长解决难题,善于沟通和团队协作
4. 后端研发技术专家/工程师-火山引擎分析型数据库 北/上/杭
职位描述
团队致力于打造一款PB级的数据库+数据分析产品,为企业客户的数据驱动型决策助力。该产品也为字节跳动内部的数据处理与决策提供支持。
1、负责字节跳动新一代分析型数仓产品的核心功能开发;
2、与团队协作,搭建稳定且易用的企业级产品特性;
3、持续与产品团队沟通,具备清晰地思路理解产品需求,并提出对应的技术解决方案;
4、具备一定行业的洞察能力,敏锐感知客户方提出的反馈与建议;
5、在产品研发周期中,确保产品的高质量,达到企业级客户的期望。
职位要求
1、计算机相关专业,本科及以上学历;
2、熟练掌握Golang, Java 或 Python 中的 2-3 种编程语言,Golang经验优先;
3、具备丰富的构建并维护大规模企业级后台系统的软件工程经验;
4、熟悉服务器端技术:RPC框架,MQ,缓存,线程池,数据分片等;
5、熟悉大数据生态环境,了解Hadoop,Hive,Kafka,Spark,Druid等大数据技术栈;分析型数据库(ClickHouse/Doris等)经验尤佳;
加分项:
6、对项目管理有经验者优先;
7、具有流利的英文交流及读写能力优先。
5. 数据湖 高级工程师/技术专家急招 上海·社招
职位描述
数据引擎-数据湖 团队,旨在打造业界领先的 EB 级超大规模数据湖,支持字节跳动众多核心业务线,如抖音、今日头条、电商。同时基于内部最佳实践,在火山引擎上打造一款云原生实时湖仓一体的 toB 产品——湖仓一体分析服务LAS(LakeHouse Analytics Service)。
1、打造业界领先的基于 HUDI的EB级数据湖,支撑字节跳动众多业务线(如抖音,今日头条,电商);
2、负责流批一体的实时数据湖存储系统的设计与研发,以及内核的极致优化;
3、与开源社区紧密合作,持续构建开源影响力,有机会成长为 HUDI Committer / PMC。
职位要求
1、具备良好的 Java / Scala 编程基础和良好的计算机技术基础;
2、具备良好的沟通能力和团队协作能力;
3、熟悉开源数据湖存储方案 Hudi,Iceberg,Delta Lake 的原理及源码,有内核开发经验或社区贡献者优先,开源社区 committer / PMC 优先;
4、熟悉 KUDU,HBase,Cassandra 等分布式存储系统,或者 Spark、Flink、Presto、Doris、Hive、Impala 等主流大数据系统原理者优先。
6. OLAP引擎专家/架构师/负责人-向量化引擎 杭州·社招
职位描述
1、打造业界领先的 PB 级 OLAP 引擎,并支撑字节跳动相关产品线;
2、产品定位类似于业内的 Velox、Photon、OmniRuntime 等产品;
3、产品旨在提供一套统一的通过 C++ 实现的极致性能的向量化执行引擎;
4、该执行引擎将加速 Spark SQL 及 Presto 为代表的大数据 OLAP 引擎,并通过火山引擎公有云产品 LAS 对外提供服务。
职位要求
1、良好的 C++ 编程基础;
2、熟悉主流的 OLAP 引擎的优化原理,向量化执行、SIMD、列式存储;
3、熟悉 Teradata、Oracle、TiDB、MySQL、OceanBase 等数据库内核优先(不要求熟悉所有技术栈);
4、熟悉 Spark、Presto、Druid、Kylin、Hive、Impala 等主流大数据系统原理及源码;
5、具备大规模系统的故障诊断与性能优化能力
7. 系统开发/算法工程师-AI for DB/System 上海·社招
职位描述
1、参与AI for DB/System前沿AI算法在OLAP系统层面的落地,目前包括查询优化以及面向OLAP负载的智能化调优解决方案;
2、系统侧:深入OLAP查询引擎内核,从AI的视角展开崭新角度的深度优化,进行分布式系统的调优;
3、算法侧:结合如火如荼的前沿AI算法研究,针对大数据系统优化这一前沿的AI探索课题,设计并应用相关PoC算法以及进行落地实践。需要梳理复杂技术以及业务问题的逻辑,进行数据清洗、结构化,规范化等特征工程工作。对于富有挑战性的技术场景问题,需要从富有创造性的视角进行数学建模;
4、参与SIGMOD/VLDB/ICLR/ICML等DB以及AI顶会上AI For DB/System相关的最新研究成果在工业界的实际落地。
职位要求
(以下两大类要求满足其一即可)
1、系统侧:
1.1、拥有DBMS/大数据系统内核开发的经历,有C++/Java开发经历的优先;
1.2、有扎实的数据结构和算法功底, 具备查询优化开发以及分布式系统调优经验的优先;
1.3、有数据库顶会包括SIGMOD/VLDB/ICDE发表者优先。
2、算法侧:
2.1、有扎实的数据结构和算法功底,熟悉机器学习、深度学习、数据挖掘中一项或多项;
2.2、拥有DBMS以及大数据系统(例如Spark)常见功能的基础使用经历,了解DBMS以及大数据系统的基本概念;
2.3、对AI技术有浓厚兴趣,并对解决全新场景的建模问题充满热情;
2.4、具备强悍的编码能力,熟悉Linux开发环境,熟悉C++和Python语言优先;
2.5、有AI算法顶会包括ICLR/ICML发表者优先