发表于2024-11-23
本书详细阐述如何选择统计检验方法,以及在应用这些方法时如何为统计理论和佳实践提供基础。本书聚焦于可应用于实际用户研究项目的方法,是作者实际工作经验、调查研究,以及对新的统计学、心理学、人因工程学的文献资料研读的结晶。它不只是对传统统计学的复述,而是为当今从业者提供了全新和切题的解读。
目 录
译者序
作者介绍
推荐序
前言
致谢
第1章 导论1
1.1 简介1
1.2 本书的组织结构1
1.3 如何使用本书2
1.3.1 应该使用何种检验2
1.3.2 我需要多大的样本量5
1.3.3 你不必手动计算6
1.4 本章要点6
1.5 本章思考题6
1.6 本章思考题答案6
1.7 参考资料7
第2章 量化用户研究8
2.1 什么是用户研究8
2.2 用户研究的数据8
2.3 可用性测试9
2.3.1 样本量9
2.3.2 代表性和随机性9
2.3.3 用户研究的三种研究类型11
2.3.4 数据收集11
2.3.5 任务完成率12
2.3.6 可用性问题12
2.3.7 任务时间13
2.3.8 出错数13
2.3.9 满意度评分14
2.3.10 复合分数14
2.4 A/B测试14
2.5 调查数据15
2.5.1 等级量表15
2.5.2 净推荐值15
2.5.3 评论和开放性数据16
2.6 需求收集16
2.7 本章要点16
2.8 参考资料17
第3章 我们的估算到底有多准确18
3.1 简介18
3.1.1 置信区间=误差幅度的两倍18
3.1.2 置信区间提供了精确度和位置19
3.1.3 置信区间的三个组成要素19
3.2 完成率的置信区间19
3.2.1 置信区间的历史20
3.2.2 Wald区间:对于小样本来说太不靠谱了20
3.2.3 精确置信区间21
3.2.4 Wald校正区间:增加两次成功与两次失败21
3.2.5 完成率的最佳点估计…23
3.2.6 遭遇可用性问题的置信区间24
3.3 等级量表和其他连续性数据的置信区间25
3.3.1 任务时长数据的置信区间27
3.3.2 任务时长均值还是任务时长中位数28
3.3.3 几何平均数28
3.3.4 大样本任务时长的置信区间30
3.3.5 围绕中位数的置信区间30
3.4 本章要点32
3.5 本章思考题33
3.6 本章思考题答案33
3.7 参考资料34
第4章 我们达到或超过目标了吗35
4.1 简介35
4.2 单侧检验和双侧检验38
4.3 完成率与基准的比对39
4.3.1 小样本检验39
4.3.2 大样本检验42
4.4 满意度评分与基准的比对43
4.5 任务时间和基准的比对47
4.6 本章要点51
4.7 本章思考题51
4.8 本章思考题答案52
4.9 参考资料55
第5章 不同设计之间有统计学差异吗56
5.1 简介56
5.2 比较两个平均值(等级量表和反应时)56
5.2.1 组内比较——配对t检验57
5.2.2 比较任务时长59
5.2.3 组间比较(双样本t检验)61
5.2.4 t检验的假设65
5.3 比较完成率、转换率以及A/B测试66
5.3.1 组间比较66
5.3.2 组内比较74
5.4 本章要点82
5.5 本章思考题84
5.6 本章思考题答案86
5.7 参考资料90
第6章 关于样本量大小的总结性研究91
6.1 简介91
6.1.1 我们为何要关注91
6.1.2 可用性研究的类型至关重要92
6.1.3 总结性可用性测试样本量预估的基本原则92
6.2 预估数值93
6.3 比较数值99
6.4 如何控制变异性104
6.5 二项置信区间样本量的估计105
6.5.1 大样本的二项样本量估计105
6.5.2 小样本的二项样本量估计106
6.5.3 与基准比例相比较的样本量109
6.6 卡方检验的样本量预估(独立比例)111
6.7 McNemar精确检验的样本预估(配对比例)114
6.8 本章要点117
6.9 本章思考题119
6.10 本章思考题答案120
6.11 参考资料123
第7章 关于样本量大小的形成性研究125
7.1 简介125
7.2 使用发现问题的概率模型来估计形成性用户研究的样本量125
7.2.1 著名方程:P(x≥1)=1-(1-p)n125
7.2.2 从1-(1-p)n中推导出样本量估计方程127
7.2.3 使用表格计划形成性用户研究样本量129
7.3 二项概率模型的假设130
7.4 模型的附加应用131
7.4.1 估计多重问题或其他事件的复合p值131
7.4.2 校正小样本p的复合评估值132
7.4.3 估计可发现的问题数和未被发现的问题数136
7.5 影响p值的是什么138
7.6 什么是合理的目标问题发现率138
7.7 调解“神奇的数字5”和“8还不够”140
7.7.1 一段历史——20世纪80年代141
7.7.2 又一段历史——20世纪90年代141
7.7.3 “神奇的数字5”的起源142
7.7.4 “8还不够”——一个调解方法144
7.8 更多关于二项概率公式及其小样本校正147
7.8.1 二项概率公式的起源147
7.8.2 紧缩校正是如何起作用的149
7.9 针对问题发现的其他统计模型151
7.9.1 对问题发现使用二项分布模型的批评151
7.9.2 扩展的二项分布模型152
7.9.3 捕获-再捕获模型153
7.9.4 在计划形成性用户研究时为什么不用其他模型153
7.10 本章要点156
7.11 本章思考题158
7.12 本章思考题答案159
7.13 参考资料159
第8章 标准化的可用性问卷163
8.1 简介163
8.1.1 什么是标准化的问卷163
8.1.2 标准化可用性问卷的优点163
8.1.3 什么样的标准化可用性问卷是有用的164
8.1.4 标准化问卷的质量评估:信度、效度和灵敏度165
8.1.5 其他项目的特征166
8.2 后续研究的调查问卷167
前 言欢迎阅读本书第2版!在这一版中,我们自始至终致力于提供关于如何检验和分析用户研究数据的最新且实用的信息。第2版的主要变化如下:
我们重新审阅了2012年以来的相关文献,并根据需要更新了内容和参考文献列表。
在本书涉及的话题中,自2012年以来在标准化的可用性问卷方面,有了最新的研究成果发表,所以我们全面更新了第8章的内容。
关于第1版,反馈最多的是希望加入相关性分析的内容。所以在第2版中我们增加全新的一章来介绍相关性分析、回归分析和方差分析。
由于全新的第10章,我们调整了第1章中的决策导图,以引导读者更好地理解书中的主题。
撰写本书的一个最主要目的是为尽可能广泛的用户体验设计师和研究人员提供切实可行的用户体验评估方法。我们从熟悉用户的研究人员最常遇到的数据着手,紧接着介绍适合分析这类数据的方法——显著性检验、置信区间和样本大小评估等。这其中包含一些较为常见的检验方法,例如t检验。然而,有一些检验方法是我们希望被纳入统计学的教学中,但目前还没有的,例如“调整的Wald二项分布比例的置信区间”(adjusted-Wald binomial confidence interval)。
我想我们可以做到的是,在基于背景因素的情况下,提供有理有据的方法建议。当遇到难以给出建议的案例时,我们也希望可以提供有效的信息,以帮助人们更好地做出决策。所有的这一切都是希望能够为创造更好的产品和服务出一份力,为使用它们的人们带来益处,为提供它们的企业带来价值。
致 谢非常感谢Morgan Kaufmann的团队邀请我们进行第2版的撰写。非常感谢Lynda Finn、Linda Lior和Phil Kortum对本书各章节初稿深思熟虑地审校。对于他们付出的宝贵时间和给予的重要建议,我们表示深深的感激。
Jeff的致谢本书代表了近10年来重新采样和研究的成果。我们阅读并参考了来自各个学科的数十篇期刊论文,以帮助我们更好地解答用户体验领域的问题。在这个过程中,我不仅找到了满意的答案,还学到了很多知识,结识了许多朋友。这其中便包括我的合著者——James R.Lewis。感谢在著书的整个过程中我的家人对我的包容和鼓励。
James的致谢感谢每一位使我对可用性研究和用户体验设计如此感兴趣的人,是他们让我对我这份事业乐此不疲——从我的合著者Jeff Sauro到IBM的用户体验团队,以及州立农业保险公司,他们是我最宝贵的学习财富,他们鼓舞了我对教育事业的不断追求。当然,还要感谢我的家人一直以来对我的支持和鼓励。
用户体验度量:量化用户体验的统计学方法(原书第2版) 下载 mobi pdf epub txt 电子书 格式 2024
用户体验度量:量化用户体验的统计学方法(原书第2版) 下载 mobi epub pdf 电子书用户体验度量:量化用户体验的统计学方法(原书第2版) mobi epub pdf txt 电子书 格式下载 2024