1、关于Kettle下面说法不正确的是:
答案:Kettle是用C语言开发的,运行速度快
2、Kettle中的作业和转换是一回事,没什么区别。
答案:错
3、在Kettle中要对两个数据表做连接操作,必须先分别进行排序
答案:对
4、要把一个Excel表格的数据导入到数据库中,可以使用Kettle的转换功能完成。
答案:对
5、要把一个Excel表格的数据导入到数据库中,应该使用Kettle的作业功能完成。
答案:错
6、Kettle可对接包括传统数据库、文件、大数据平台、接口、流数据等数据。
答案:对
7、Kettle中作业项是作业内部的执行单元,每一个作业项用于实现特定的功能,如验证表是否存在,发送邮件等。
答案:对
8、Kettle中转换和作业都可以作为作业项。
答案:对
9、Kettle连接数据库出问题可能是因为缺少驱动包,下载相应的驱动放到Kettle的lib文件夹下面即可。
答案:对
10、在Kettle中Job中的作业项是串行执行的。
答案:对
11、在Kettle中作业文件的扩展名是:
答案:.kjb
12、ETL数据抽取的周期是根据业务的需求制定的,如按小时抽取,或者按天、月、季度、年等抽取。
答案:对
13、在Kettle中转换文件的扩展名是:
答案:.ktr
14、ETL数据加载策略包括时间戳的加载方式、全表对比的加载方式、通过读取日志表进行加载的方式、全表删除后再进行加载的方式。
答案:对
15、ETL在做数据抽取时应该尽量选择源数据系统使用的高频时段。
答案:错
16、Kettle一个转换中,一个步骤可以有多个连接,数据流可以从一个步骤流到多个步骤。
答案:对
17、Kettle一个转换中,一个步骤只能有一个连接,数据流只能从一个步骤流到另一个步骤。
答案:错
18、ETL中数据加载中的时间戳加载方式可以实现数据的递增加载。
答案:对
19、关于ETL中全表对比的加载方式,下列说法错误的是:
答案:全表对比效率最高
20、ETL中通过读取日志表进行加载数据的方式是一种安全可靠的方式,没有风险。
答案:错
21、一个完善的ETL系统必须具有流程步骤控制能力,系统的划分和流程调度的能力,有合理的调度算法,有日志和警告系统,且有较高的可靠性。
答案:对
22、商业的ETL软件一般具有更强大的功能和良好的售后服务。
答案:对
23、查看网页的编码格式为打开网页源代码,找到charset字段。
答案:对
24、XPath选取元素的属性用:
答案:@
25、XPath获取元素的文本信息用:
答案:/text()
26、XPath在使用前需要先安装lxml。
答案:对
27、xPath定位没有具体属性的标签,在标签后加序号获取,例如span[2],表示获取第2个span标签。
答案:对
28、关于正则表达式函数描述错误的是:
答案:match与search作用相同,可以替换使用
29、正则表达式,关于*和.在匹配次数方面的描述错误的是:
答案:.表示匹配任意字符
30、关于正则表达式的贪婪模式和非贪婪模式以下描述正确的是:
答案:贪婪模式表示尽可能多的匹配,匹配模式:(.*),非贪婪模式表示尽可能少的匹配,匹配模式:(.*?)
31、python正则表达式的模式修饰符I表示匹配时,忽略大小写。
答案:对
32、python正则表达式的模式修饰符M表示匹配时,让.匹配换行符。
答案:错
33、python正则表达式的模式修饰符S表示匹配时,表示多行匹配。
答案:错
34、python中正则表达式,匹配十进制数字为:
答案:\d
35、python中正则表达式,表示数字恰好出现4次,如何表示?
答案:\d{4}
36、python中正则表达式中,|表示模式选择符,可以用于匹配两种匹配模式。
答案:对
37、python中正则表达式,能够匹配8-15位的QQ号码的是?
答案:\d{8,15}
38、python中正则表达式,[pyh]表示?
答案:匹配p、y或h这三个字符
39、python中正则表达式,匹配非空白字符的模式为[^\s]
答案:对
40、python中正则表达式,非获取匹配用?
答案:(?:.com)
41、以下描述是否正确,UA是User-Agent的缩写,表示用户代理,一个特殊字符串头,使得服务器能够识别客户使用的浏览器及版本。
答案:对
42、Selenium安装好之后,就可以直接使用了。
答案:错
43、使用Selenium之前,需要先声明浏览器对象。
答案:对
44、Selenium元素查找,表示按照名称查找的是:
答案:find_element_by_name
45、Selenium中,获取元素标签名为:
答案:tag_name
46、selenium中元素交互操作,表示输入回车代替点击搜索按钮的是:
答案:driver.find_element_by_id('kw').send_keys(Keys.ENTER)
47、元素交互操作,表示鼠标单击的是:
答案:click()
48、Scrapy项目中,在items文件中定义要爬取的字段。
答案:对
49、查看Scrapy的版本号,命令为scrapy version –v。
答案:对
50、关于用Python向MySQL数据库插入数据,描述正确的是:
答案:可以一次插入一条记录,也可以一次插入多条记录