免师教育硕士学科教育测量与评价答案

来源:高二 发布时间:2020-09-24 点击:

 西南大学研究生课程考试

 答

 卷

 纸

 考试科目

 教育测量与评价

 院

 、所、中心

 外国语学院

 专业或专业领域

 研究方向

 级

 别

 学

 年

 2013 -2 2 01 1 4学年

 学

 期

 24 014 年秋季学期

 姓

 名

 学

 号

 类

 别

 ③

  ( ( ①全日制博士

 ②全日制硕士

 ③教育硕士

 ④高师硕士

 ⑤工程硕士

 ⑥农推硕士

 ⑦兽医硕士

 ⑧进修) )

 2 2 014 4 年

 7

 月

 18 日

 研 究 生 院 ( (筹 筹 ) )制 制

 课

 程

 类

 别

  课程考试方式

  题号

 得分

 教

 师

 评

 价

 一

  二

 三

 四

 五

 六

 七

 八

 九

 十

 总 分

 任课教师签名: :

 备注:成绩评定以百分制或等级制评分,每份试卷均应标明课程类别(①必修课②选修课③同等学力补修课)与考核方式(①闭卷笔试②口试③开卷笔试④课程论文)。课程论文应给出评语。

 西南大学

 外国语学院

 免师教育硕士 2 2 04 14 级

 “学科(英语) ) 教育测量与评价”课程作业

 要求:

 保留原题题干及数据, 然后在其下面插入空白来呈现答案。不得篡改问题或者数据。

 在编辑将要提交得作业得 Word 文件时, 需确保欲呈现得内容能被打印出来。

 一、简答题 (50 分) 1. 测量得基本要素有哪些?(1 分)

 答:测量得量具、测量得单位与测量得参照点就是测量得三个基本要素。

 2. 什么就是教育测量?(1 分) 答:教育测量就就是针对学校教育影响下学生各方面得发展,侧重从量得规定性上予以确定与描述得过程。

 3. 教育测量有哪些量表类型?(1 分) 答:有称名量表、顺序量表、等距量表与比率量表。

 4. 什么就是教育评价?(1 分) 答:教育评价就是指根据一定得标准,对教育事物或现象进行系统得调查,在获取足够多得资料事实(定性与定量资料)基础上,做出价值分析与价值判断。

 5. 教育测量与教育评价有什么不同?(1 分) 答:教育测量时一种以量化为主要特征得事实判断,而教育评价就是指根据一定得标准,对教育事物或现象进行系统得调查,在获取足够多得资料事实(定性与定量资料)基础上,做出价值分析与价值判断。所以教育评价最根本得特征就是做出价值判断;而教育测量过程得完结,在给出数量事实得描述与判断之后,不一定都要做出价值判断。

 6. 教育评价与教育评估有什么异同?(1分) 答:教育评估与教育评价就是两个近义词, 她们在内容上有交叉,也有区别。

 教育评估可能有价值判断,也可能没有价值判断当教育评估过程含有价值判断时,它与教育评价就是一样得;当教育评估过程没有价值判断时,它与教育评价就有一定得差别。

 7. 教育测验、考试与教育测量有什么不同?(1 分) 答:教育测验就是教育测量得一个工具,在教育评价与教育评估过程中常被用来收集资料(如有关态度测验、民意问卷测验、学科成就测验等)。教育考试就是根据教育内容与目标,选择有代表性得内容与问题,按照一定得方式,对应试者得知识、技能等进行测量与评价得过程。考试也就是一种教育测验。测验或考试皆就是教育测量与评价得一种工具。

 8. 教育测量与评价,按照实施得时间阶段得不同,可以区分为哪几种类型?各自使用得目得就是什么?(1 分)

 答:可以分为形成性测量与评价、诊断性测量与评价与终结性测量与评价。形成

 下测量与评价得目得对于老师而言就是为了获得教学延续性得反馈,了解学生得学习效果、学习历程、学习特点、学习困难等信息,随时修正自己得教学参考;对于学生而言可以根据反馈得结果获知自己学习后得表现情况。从而肯定或修正自己得学习方式。诊断性测量与评价得目得就是对个人得问题行为及原因进行诊断。终结性测量与评价得目得有两个,一就是在教学目标之下,检查学生一学期得学业达到了什么程度,从而判断教学效果得得失;二就是评定学生得学业成就,并将评定结果通知家长或记入档案。

 9. 教育测量与评价,按照参照点得不同,区分为哪几种类型?各自适用得情形就是什么?(1 分) 答:分为常模参照、标准参照与潜力参照。常模参照适用于评价被团体中得相对地位;标准参照测量与评价就是将被试得表现与既定得教育目标或行为标准相比较,以评价被试在多大程度上达到标准;潜力参照测量与评价就是将被试实际水平与其自身潜在水平相比较,以评价被试有无充分发挥自身潜力得目得。

 10. 教育测量与评价,按照被测量与评价得行为得性质,区分为哪些类型?它们各自适用于什么情形?(1 分) 答: 分为最佳行为测量与评价与典型行为测量与评价。最佳行为测量与评价适用于以能力为基础得评价情景,例如学校教学后得考试或升学考试;典型行为测量与评价适用于测量被试得态度、情感、人格、兴趣等。

 11. 按照教育测量与评价得内容, 教育测量与评价区分为哪几种类型?它们各自适用于什么情形?(1 分) 答:分为智力与评价、能力倾向测量与评价、成就测量与评价与人格测量与评价。

 12. 什么就是重测信度?(1分) 答:重测信度指得就是用同一个量表(测验与评价表)对同一组被试施测两次所得结果得一致性程度,其大小等于同一组被试在两次测验上所得分数得相关系数。

 13. 什么就是复本信度?(1 分) 答:复本信度指得就是两个平行测验测量同一批被试所得结果得一致性程度,其大小等于同一批被试在两个复本测验上所得分数得相关系数。

 14. Kappa 一致性分析可以用来说明教育测量与评价得哪些类型得信度?(1 分) 答:Kapa 一致性系数就是指实际别评定为一致得百分比与在理论上被评定为一

 致得最大可能次数百分比得比率。

 15. 肯德尔与谐系数分析得功能就是什么?(1分)

 答:肯德尔与谐系数时表示多列等级变量相关程度得一种方法,既让 K 个评价者对 N 个被试得试卷(或作品)进行登记评定,每个评价者都对 N 份试卷(或作品)排出一个等级顺序。

 16. 什么叫分半(half-split)信度? (1 分)

 答:分半信度指得就是将一个测验分成对等得两半后,所有被试在这两半上所得分数得一致性程度。

 17. 什么叫克伦巴赫 alpha系数?(1分) 答:克伦巴赫alpha 系数就是一套常用得衡量心理或教育测验可靠性得方法,依一定公式估量测验得内部一致性,就是目前社会研究最常使用得信度指标,它就是测量一组同义或平行测"总与"得信度其公式为:a=[K/(K-1)][1-(∑S2i)/(S2x)]、其中,K 为量表中题项得总数,S2i 为第 i 题得分得题内方差,S2x为全部题项总得分得方差、从公式中可以瞧出,a系数评价得就是量表中各题项得分间得一致性,属于内在一致性系数、这种方法适用于态度、意见式问卷(量表)得信度分析。

 18. 什么叫效度(validity)?什么叫效度验证(validation)?(1分) 答:效度指得就是一次测量得有效程度,通过收集大量资料与证据来检验测量效度得工作过程叫做效度验证。

 19. 什么叫内容效度?什么叫表面效度?什么叫反应效度?(1 分) 答:内容效度指得就是测验样本对于应测内容与行为领域得代表性程度,表面效度指得就是在被试与非专业人士瞧来,测试表面上就是否在有效得测量着应测特质得量得程度。

 20. 什么叫构念(construct)? 什么叫构念效度(construct validity)? (1 分) 答:构念指得就是心理学或社会学上得一种理论构想或特质,结构效度指得就是测验能够测量到理论上所定义得某一心理结构或特质得程度。

 21. 什么叫效标(Criterion)? 什么叫效标效度(criterion-related validity)? (1 分)

 答:效标志得检验测量效度得外在得、客观得标准,即效度标准,效标关联效度指得就是一个测验对于处于特定情境中得个体行为进行预测时有效性。

 22. 什么叫同期效度(concurrent validity)与预测效度(predictive validity)? (1 分) 答:测验分数与效标资料得取得约在同一时间内连续完成,计算这两种资料得相关系数即代表测验得同时效度,在测验分数取得一段时间后才获得效标资料,计算这两种资料间得相关系数即代表测验得预测效度。

 23. 试题得难度系数可以怎么计算?(1 分)

 答:对于二值记分题可以用题目得答对率来表示,对于多值记分题可以用平均分与满分得比值来表示,此外还可以全体被试失分率为难度系数,以两端被试得分率得均值为难度系数。

 24. 什么就是测试题目得区分度(Discrimination Index)? 题目得区分度如何计算?(1 分) 答:区分度就就是题目区分被试谁批能力得量度,计算区分度可以用点双列相关系数法,二双列相关系数法,积差相关系数与高低分组法来计算。

 25. 什么就是级差相关(Pearson correlation)? (1 分) 答:级差相关指得就是对非二分法积分得项目,因得分具有连续性,在被试团体较大时,可以认为题目分数服从正态分布,题目总分与测验总分级差相关系数。

 26. 什么就是等级相关(Spearman correlation)? (1 分) 答:对不服从正态分布得资料、原始资料等级资料、一侧开口资料、总体分布类型未知得资料不符合使用积矩相关系数来描述关联性。此时可采用秩相关(rank correlation),也称等级相关,来描述两个变量之间得关联程度与方向。

 27. 什么就是点二列相关(point-biserial correlation)? 在 SPSS 中,怎么计算点二列相关系数?(1 分) 答:点二列相关指得就是两个变量都就是正态连续变量,但其中一个变量因为某种原因被人为地分成两类。

 28. 什么正相关?什么就是负相关?(1 分) 答:正相关指得就是因变量随着自变量得增大而增大,负相关因变量随着自变量得增大而变小。

 29. 什么就是相关系数显著性检验中得双侧(2-tailed)检验与单侧(1-tailed)检验?(1 分) 答:在相关系数显著性检验中,1-tailed test 与 2-tailed test分别指单侧检验与双侧检验,单侧检验具有方向性,更有针对性,而双侧检验就是指一组数据得方差可能大于,等于或小于另一组数据得方差得情况,不具有方向性。

 30. 什么就是独立样本(independent samples)?什么就是相关样本(related samples)?(1 分) 31. 什么就是独立样本 t 检验中得双侧(2-tailed)检验与单侧(1-tailed)检验?(1分)

 32. 通常情况下,教育评价表得构成要素有哪些?(1 分) 答:(1)评价指标 (2)指标权重 (3)评价标准 33. 什么就是评价标准得标度, 标号,强度或频率?(1 分) 答:标度就是达到标准得程度,它说明什么样得程度属于什么等级。所谓得标准强度与频率,就是指评价标准得内容,也就就是各种规范行为或对象得程度或相对次数。标准强度与频率属于评价得主要组成部分。所谓标号,就是指不同强度得频率得标记符号, 34. 什么就是客观性试题与主观性试题?客观性试题与主观性试题分别有些什么类型?(2 分) 答:客观性试题评分客观,不同评分者独立评分,所得结果基本上就是相同得,客观性试题 主要包括选择题、匹配题与供答题中地简答题、填空题;主观性试题指得就是答案不固定,被试可以自由作答,被试只要在题目所限得范围内,在深度、广度、组织方式等方面享有很大得自由,包括论述题、作文题与表现性测验题等题型。

 35. 什么就是表现性测验?表现性测验有些什么类型?(2 分) 答:所谓表现性测验就是指以行动、作品、表演、展示、口头回答、操作、写作、科学研究、制作等更真实得行为表现,来测量与评价学生在真实情景或模拟真实情景下得所知所能得一种测验类型。表现性测验分为(1)纸笔得表现性测验、辨认得表现性测验、结构化得表现性测验、模拟情景得表现性测验、工作样本得表现性测验。

 36. 教育目标, 教学目标, 测验目标几者之间有什么关系?(2分) 答:教育目标分为终极教育目标、中程教育目标与具体教育目标。教学目标就是

 中程教育目标,就是对终极教育目标得细化与具体落实,她对学生应掌握得知识,应发展得能力与应该形成得优良品德提出了明确要求,将教学目标进一步分化,用测试题得形式加以表达就就是测验目标。

 37. 布卢姆教育目标分类得认知领域得内容,在早期理论与修订版框架之间, 有什么异同?(2 分) 38. 答:原始得分类法(1956)分成知识与心智得能力与技巧两部分,共 6 个类别。除了应用外,每一个类别都包含了子类别。这些类别就是从简单到复杂、具体到抽象进行排列,强调累积性得阶层概念。修订版将教育目标得分类分成知识向度与认知历程向度。知识向度包含四个主要得类别(事实、概念、程序、 元认知)。前三个类别包括了原始分类中知识得子类别。元认知知识就是新增加得类别。认知历程向度分成 6 个类别,由较低层级得记忆、了解、应用与分析,到较高层级得评价与创造,其中记忆与学习保留有密切得关联,其余五者与学习迁移较有关。原始分类中得三个类别被重新命名,两个类别得顺序被交换。

 39. 布卢姆教育目标分类得经典理论中得认知领域得 1 级与2级目标内容有哪些?(3 分) 40. 答:认知领域得一级目标就是知识,二级目标就是领会、运用、分析、综合与评价。

 41. 布鲁姆教育目标分类体系得情感领域得1级与 2 级目标内容有哪些?(3分) 答:情感领域得 1 级目标内容有接受与反应,二级目标有价值评价、组织、有价值与价值复合体形成得性格化。

 42. 布鲁姆教育目标分类体系得动作技能领域得 1 级与 2 级目标内容有哪些?(3分) 答:动作技能领域得1级目标内容包括知觉、准备、指导反应;2 级目标包括机械化、复杂反应、适应性与独创性。

 二、计算题 (35 分)

 1、 有 30 个被试在间隔不久得时间内前后两次接受了同一个测试。其测试结果如下表所示。问这个测试得信度如何?(2、5 分)

 被试 前测 后测 被试 前测 后测

  2 67 70 17 76 69 3 75 73 18 81 80 4 66 68 19 90 88 5 81 78 20 88 87 6 90 87 21 87 76 7 69 71 22 75 74 8 73 72 23 76 78 9 81 79 24 81 82 1

 11 69 71 26 79 83 12 69 72 27 82 80

 9

 6

 4 答:本次测试得重测信度为 0、41,信度较低。

 2、 有一个测验含A、B 卷。30 个被试分别接受了 A 卷与B卷得测验, 测验结果如下表所示。问这个测验得 A、B 两份试卷得等值系数如何?(2、5分)

 被试 A 卷 B 卷 被试 A卷 B 卷

  2 67 66 17 76 75 3 75 73 18 81 80 4 66 68 19 87 88 5 81 80 20 88 87 6 71 72 21 86 83 7 69 71 22 75 74 8 73 72 23 76 74 9 72 73 24 81 82 1

 11 73 71 26 79 81 12 69 72 27 82 80

 6

 6

 4 3、 有 100个被试接受了一个测验,其测验结果被两个评分员独立地进行了二分法得评价(即“及格”与“不及格)。两个评分员对这些被试得评价结果得频数信息见下面得频数分布表。问这两个评分员得评价结果得一致性如何?(5 分)

  评分员B 及格 不及格 评分员 A 及格 70 10 不及格 5 15 解:两位评分员得百分比一致性 P A = 0、 8 5 ; k 一致性系数 k=0、36。两位评分员评分得一致性较高。

 4、 有一电影网站对观瞧其电影得10名观众进行了调查。调查得就是她们对于各类电影得偏爱程度, 从 1 到 8, 代表从“最喜欢”到“最不喜欢”得 8 种态度。问这 10 个接受调查得观众得电影爱好显著一致吗?平均而言,她们对被调查得 8 种电影类型各自得偏爱程度如何?(5分) 电影类型 观众 1 2 3 4 5 6 7 8 9 10 犯罪 3 5 2 3 4 4 3 2 4 3 战争 6 6 7 8 7 5 7 8 8 6 谍战 5 4 5 7 6 6 8 4 5 4 武侠 1 8 1 2 8 2 2 1 1 2 悬疑 4 3 4 4 3 8 5 6 3 8 喜剧 2 2 8 1 1 1 1 3 2 1 爱情 8 7 6 5 5 7 6 5 7 7 伦理 7 1 3 6 2 3 4 7 6 5 解:这十位观众得肯德尔与谐系数 W=0、57,10位观众对 8 种类型喜爱程度得显著性较一致。

 观众对8种类型得电影得喜爱程度得平均数分别为3、3,6、8,5、4,2、8,4、3,2、2, 6、3, 4、4,由此可见观众最喜欢得类型就是战争类与爱情类电影,其次为谍战、伦理、悬疑类,最不喜欢得喜剧与武侠类。

 5、 一研究者进行了一个教学实验。在实验班采用积极培养与引导学生使用优秀学习者得学习策略得方法进行阅读理解得教学,而在对照班则按照传统得讲解与完成多项选择练习得方法进行教学。研究者期望实验班得教学效果优于对照班得效果。在实验开始前挑选了实验组与对照组得受试,各有 36人,并对她们得阅读能力进行统一得测试(前测)。然后, 实施了教学实验。经过一个学期后,研究者对两个组得受试实施了题型与难度与前测近似得另一个

 测试(后测)。两个组受试得前测与后测成绩如下表所示。问两个组得受试在实验前得阅读水平相当吗?研究者得新得教学方法有明显得优势吗?(请报告结果并解释结果)(10分) 被试

 前测

 后测

 实验组

 对照

 实验组

 对照组

 1 61 57 72 60 2 60 59 73 61 3 63 58 71 59 4 62 73 75 72 5 63 60 72 61 6 78 62 73 62 7 66 57 74 57 8 69 70 75 58 9 65 60 70 59 10 63 59 71 60 11 77 60 70 61 12 66 66 72 62 13 65 62 74 60 14 60 57 78 58 15 61 56 73 55 16 61 58 76 59 17 67 62 72 63 18 62 62 77 64 19 62 61 75 60 20 52 66 73 67 21 66 65 74 64 22 67 59 77 58 23 65 58 77 59 24 68 67 76 68 25 53 68 75 69 26 56 59 76 60 27 70 59 75 61 28 68 61 77 60 29 53 56 78 59 30 55 63 74 62 31 69 60 74 58 32 72 62 73 61 33 64 60 75 59 34 54 61 76 60

 35 69 68 72 65 36 71 68 73 63 6、 下面就是5个受试做一个试卷得 5 个部分得得分数据。问这个试卷得内部一致性信度如何?请分析一下第 3 部分得区分度?(10 分) Subject Part1 Part 2 Part 3 Part 4 Part 5 Total 1 8 7 7 9 8 39 2 12 10 11 12 12 57 3 9 8 7 7 9 40 4 12 9 9 9 12 51 5 12 10 10 4 12 48 解:5个受试得克龙巴赫系数 ὰ=0、54,由此可见,试卷得内部一致性不高,第三部分得积差相关系数r=0、94,区分度很高。

 三、图表制作题 (15 分)

 1、 请绘制一个测验得命题双向细目表, 并做简单得文字说明。(10 分) 高二英语期末测试试题 双向细目表

 题

 型 考查内容 题量/题号 识 记 理解 掌 握 综合

 应用 小记分 分值比例 听 力 听力 1-20 √

  √ 1 30 语 言 知 识 、 语 法 单 项 选 择 交际用语 21、35

 √

 √ 2 15 倒装:As引导得让步状语从句得倒装、only 接状语从句引起得倒装 22、28 √

  √ 2 时态:一般现在时、过去进行时、过去完成进行时 23、24、29

 √

 √ 3 连词辨析 25

 √

  1 动词短语辨析 26 √ √

  1 非谓语动词:V-ing 形式作后置定语 27

 √

 √ 1 副词短语辨析:rather than\ other than 30 √ √

  1 限制性定语从句:whose 31

 √

 √ 1 情态动词:should have done 32 √

 √

 1 冠词 33

 √

  1 动词词义辨析 34 √ √

  1 完 形 填 空名词词义辨析 7 个

 √ 10、5 30 动词词义辨析 9 个

 √ 13、动词短语辨析 1 个

 √ 1、5 形容词词义辨析 3 个

 √ 4、5 阅读 综合 能力 考查 A 记叙文 推理判断 56、57、59

 √ 6 40 细节判断 58

 √ 2 B 说明文 推理判断 60、61、62

 √ 6 细节理解 63

 √ 2 C 新闻实事

 词义猜测 64

 √ 2 细节理解 65

 √ 2 主旨大意 66

 √ 2 D广告宣传 细节判断 67

 √ 2 推理判断 68、69、70

 √ 6 短 文 改 错

 非谓语动词

  √ 1 10

 副词 here

 there

  √ 1

  冠词

  √ 1

 连词:but/ and

  √ 1

 介词错用

  √ 1

  介词多余

  √ 1

  名词单复数

  √ 1

 名词所有格

  √ 1

 主谓一致

  √ 1

 时态

  √ 1 书面

 应用文:求助信

  25 25

 2、 请按照布鲁姆教育目标分类得修订版中关于认知领域得教育目标得内容,绘制一个认知教育目标双向表。(5分)

 知识纬度 认知过程纬度 1、 记忆/回忆 (Remember) 2、

 理解 (understand)

 3、

 应用 (Apply) 4、 分析 (Analyze) 5、 评价 (Evaluate) 6、 创造 (Create)

 A、

 事实性知识 (Factual Knowledge)

  B、 概念性知识 (Conceptual Knowledge)

  C、 程序性知识 (Procedural Knowledge)

  D、 元认知知识

  表达 合计 86 45

 23 150

 (Metacongnitive Knowledge)

推荐访问:测量 学科 答案
上一篇:财政国库管理制度改革试点方案
下一篇:学习领会总书记湖南调研心得体会

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有