datax 面试题_come on!大数据高薪职位面试题，你会多少呢？

2023-03-18 22:14:48

datax 面试题_come on!大数据高薪职位面试题，你会多少呢？

以下是面试的三家公司的面试题

第一家

数据源有哪些？指标是什么
在做项目时，约定和配置你们是怎么选的
datax到数据到hdfs
datax的并发条件
使用linux查看hive的表
hive命令查看内部表外部表
kafka的分区
hbase批量写数据出现行级事务锁
linux查看文件的前10行
sqoop的并发操作以及并发条件
对于hadoop节点如何动态上下线
分组求和：用mapreduce实现
kafka redis怎么选型用在什么场景
hive 表结构经常变化怎么处理(除了外部表有什么其他解决方案)
mongodb即作为元数据信息和规则信息，还存储一些图片文章，马上mongodb出现了瓶颈了，如何解决
集群一台 dstanode挂了怎么复制的
kafka 不丢数据怎么做
spark-streaming数据倾斜的两种原因，以及解决办法
mysql的单例和联合索引
mysql数据库备份方式
设计一个责任链

第二家

scala和java的区别
反射在spark中的应用
反射在hadoop中的应用
反射和泛型
sql中的left join 和 join区别
在a.sh中执行b.sh
hive的数据倾斜怎么解决
文件大小1G，每一行就是一个单词，求频率最高的单词的top100 ，要求只用1M内存
spark和sparkStraming中的常用代码
hive的新用户和老用户查询登录的问题
使用hive求日留存和pvuv
使用hive求连续登陆的用户
Kafka原理

第三家

hive的外部表与内部表区别
hive的分区和分桶的区别
hive的索引
hdfs的ha中，zookeeper所起到的作用
监控，服务发现
zookeeper平时有哪些作用
mr的shuffle和spark的shuffle的区别
flink和sparkStreaming的区别
机架感知(上传文件后是怎么存储的)
hdfs的写数据流程
spark2.0新特性
实现sparkStreaming的HA
checkpoint的缺陷

datax 面试题

上一篇: DataX入门———用法及一些简单的案例介绍一、概述二、安装三、案例介绍

下一篇: datax oozie调用

继续阅读

datax 面试题_朋友面试某大厂大数据开发工程师遇到的面试题
datax 面试题
01-15