当前位置

首页 > 文学百科 > 面试技巧 > 百度数据分析员面试测试题

百度数据分析员面试测试题

推荐人: 来源: 阅读: 1.76W 次

大概一个月前,笔者接到百度的面试电话,去应试数据分析员的工作。尽管无意去工作,但是还是希望能看看他们的测试题到底是怎么样的。于是接触到了一下的题目:

百度数据分析员面试测试题

总共十个题目(当然全是excel函数题):

1、根据员工的身份证号,统计员工的生日。众所周知,我国居民身份证号有18位和15位数之分。对于同样位数的身份证号统计想必不是很难,但是混杂了两种情况的统计怎么来做呢?

背景材料:

15位的身份证号码:450104771010156

(1)1~6位为地区代码

(2)7~8位为出生年份(2位),9~10位为出生月份,11~12位为出生日期

(3)第13~15位为顺序号,并能够判断性别,奇数为男,偶数为女。

18位的身份证号码:450104197710101516

(1)1~6位为地区代码,

(2)7~10位为出生年份(4位),如1977

(3)11~12位为出生月份,如10

(4)13~14位为出生日期,如10

(5)第15~17位为顺序号

2、从备注材料中抽提其中的物料代码,代码的格式是“0000-00000”,备注是文字和数字的混合。如“某某客户投诉0000-00000产品有质量问题,香气偏淡”。让你写出函数从中提取出物料代码。

3、AB列各有N多个单字节文本,但其中个别单元格有空白。要求:B3单元格有文字就显示B3单元格,若B3无文字而A3有,则显示A3单元格文字,如果A3也没有文字,则显示“济南”。

4.有个物料库存区域,有诸多原料进仓数据,单个原料有多次进仓记录的,让统计部分原料的库存总数量。

5、考勤情况统计。A代表上班,K旷工,S迟到,B病假,W出差

按照日期记录每个员工的考勤情况。月底对员工考勤情况进行统计。

6、小数点的取舍。保留小数点后两位,和截留取整。

7、有一副用数字0填充单元格组成的图画,让改变该副图画的背景颜色。

还有三个题时隔久远,一时想不起了,抱歉,只能发这几个题了。

知道答案的可以在随后的评论中写出,猜不出的可以问我。

--

--以下为本人收集的几种数据分析工具--

T

QUEST是IBM公司Almaden研究中心开发的一个多任务数据挖掘系统,目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。系统具有如下特点:

提供了专门在大型数据库上进行各种开采的功能:关联规则发现、序列模式发现、时间序列聚类、决策树分类、递增式主动开采等。

各种开采算法具有近似线性(O(n))计算复杂度,可适用于任意大小的数据库。

算法具有找全性,即能将所有满足指定类型的模式全部寻找出来。

为各种发现功能设计了相应的并行算法。

Set

MineSet是由SGI公司和美国Standford大学联合开发的多任务数据挖掘系统。MineSet集成多种数据挖掘算法和可视化工具,帮助用户直观地、实时地发掘、理解大量数据背后的知识。MineSet有如下特点:

MineSet以先进的可视化显示方法闻名于世。

提供多种 萃诰蚰J健0 ǚ掷嗥鳌⒒毓槟J健⒐亓 嬖颉⒕劾喙椤⑴卸狭兄匾 取?br>

支持多种关系数据库。可以直接从Oracle、Informix、Sybase的表读取数据,也可以通过SQL命令执行查询。

多种数据转换功能。在进行挖掘前,MineSet可以去除不必要的数据项,统计、集合、分组数据,转换数据类型,构造表达式由已有数据项生成新的数据项,对数据采样等。

操作简单、支持国际字符、可以直接发布到Web。

ner

DBMiner是加拿大SimonFraser大学开发的一个多任务数据挖掘系统,它的前身是DBLearn。该系统设计的目的是把关系数据库和数据开采集成在一起,以面向属性的.多级概念为基础发现各种知识。DBMiner系统具有如下特色:

能完成多种知识的发现:泛化规则、特性规则、关联规则、分类规则、演化知识、偏离知识等。

综合了多种数据开采技术:面向属性的归纳、统计分析、逐级深化发现多级规则、元规则引导发现等方法。

提出了一种交互式的类SQL语言数据开采查询语言DMQL。

能与关系数据库平滑集成。

实现了基于客户/服务器体系结构的Unix和pC(Windows/NT)版本的系统。

L MATLAB Origin 等等

当前流行的图形可视化和数据分析软件有Matlab,Mathmatica和Maple等。这些软件功能强大,可满足科技工作中的许多需要,但使用这些软件需要一定的计算机编程知识和矩阵知识,并熟悉其中大量的函数和命令。而使用Origin就像使用Excel和Word那样简单,只需点击鼠标,选择菜单命令就可以完成大部分工作,获得满意的结果。 但它又比excel要强大些。一般日常的话可以用Excel,然后加载宏,里面有一些分析工具,不过有时需要数据库软件支持。


赞助商

赞助商