招聘频道
当前位置:首页 > 名企招聘 > 面试题
发布日期:2106-02-07   

每天跑多少数据?100g数据跑多久hadoop十分钟,spark几秒钟—不超一分钟,项目大概有多少mr一般来讲---大概三十多个,介绍几个reduce计算的什么自己发挥说一下项目字段。

发布日期:2018-08-17   

hive的外部表怎么创建?如何使用hive来操作hbase里边的数据?创建外部表的好处是数据可以随时从hdfs中挂载进表中使用分区的好处是可以缩短查询范围。

发布日期:2018-08-17   

hbase里边有10亿条记录,请问用实时技术检索该记录用了多长时间?因为HBASE基于内存做检索,在ROWKEY设计非常理想状态下检测速度大概在10秒钟左右实时分析架构用到了哪些技术。

发布日期:2018-08-17   

sort by 和 group by 的区别:当时她问完我Hadoop就问我,我就有点蒙,总觉得是在说Hadoop里面有这两个东西,但是我又想不起来哪里有,就说了不知道,他就说不应该啊~后来才反应过来是数据库的知识。

发布日期:2018-08-17   

什么是负载均衡?建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。分摊到多个操作单元上进行执行,例如Web服务器、FTP服务器、企业关键应用服务器和其它关键任务服务器等,从而共同完成工作任务。

发布日期:2018-08-17   

越来越多的机器配备了连续测量和报告运行情况的装置。几年前,跟踪遥测发动机运行仅限于价值数百万美元的航天飞机。现在,汽车生产商在车辆中配置了监视器,连续提供车辆机械系统整体运行情况。一旦数据可得,公司将千方百计从中渔利。这些机器传感数据属于大数据的范围。

发布日期:2018-08-17   

MR提交时是否有失败,失败了怎么办?出现错误主要有以下三种:1、Task任务;2、JobTracker失败;3、TaskTracker失败。

发布日期:2018-08-17   

手写MR中主函数内容、用Java写字符串的倒序输出:字符串倒叙String str = “abcdefg”;StringBuffer sb = new StringBuffer();for(int i=str.length()-1;i>=0;i--){sb.append(str.charAt(i));}System.out.println(sb.toString());

发布日期:2018-08-17   

使用python爬虫的时候怎么爬取数据,爬取哪些数据,爬去之后用来进行做什么样的业务。通过分析要爬取的网页请求,和请求的返回数据类型,如果是html页面,那么就去通过BeautifulSoup等XML解析工具去解析,如果是JSON数据,那么直接进行转换成字典分析,要爬取的数据是关键的数据。

发布日期:2018-08-17   

爬取好的数据为什么不适用python一次性的处理完成,进行展示爬取的数据有两点,一数据量大,这就导致了使用python处理数据的难度非常大,异常缓慢,二数据内容杂,很多缺项的数据混进来,对我们的分析处理产生干扰,而python是难以筛选这些数据的,所以往往我们要通过集群进行大量数据的清洗,然后通过算法分析产生的结果进行展示。

发布日期:2018-08-17   

在Python中,最基本的数据结构是序列(sequence)。序列中的每个元素被分配一个序号——即元素的位置,也称为索引。第一个索引是 0,第二个则是 1,以此类推。序列中的最后一个元素标记为 -1,倒数第二个元素为 -2,以次类推。

发布日期:2018-08-17   

MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),MySQL数据库系统使用最常用的数据库管理语言--结构化查询语言(SQL)进行数据库管理。你常用的数据库是什么?

全国咨询热线:400-690-5006,值班手机:18501996998(7*24小时)

在线咨询:李老师QQ(226594285),陈老师QQ(428683440)

企业合作服务专线:010-82340234-821, 院校合作洽谈专线:010-82340234

Copyright 2001-2017 魔据教育 - 北京华育兴业科技有限公司 版权所有,京ICP备17018991号-2

免费在线咨询立即咨询

免费索取技术资料立即索取

大数据技术交流QQ:226594285

电话咨询010-82340234