什么是异常数据?如何处理异常数据?在一个测量列中,可能出现个别过大或过小的测定值,其数值明显偏离其余观测值,这种包含巨大误差的测定值,通常称为异常数据。异常数据往往是由过失误差引起的,也可能是由巨大的随机误差引起的。在重复试验过程中,得到一系列测量值,如果混杂有异常数据,则必然会歪曲测量结果,造成极大的误差。因此,必须在各个测量值中找出异常数据,并舍弃之,直到无异常数据时,才可进行有关的数据处理而得到正确的结果。异常数据的取舍必须十分慎重。如果有充分的根据可以判定异常数据是由过失误差引起的,则应予舍弃。但严格说来,原始数据必须实事求是地记录,并注明有关情况,在整理数据时,再舍弃上述有明显错误的数据。对于原因不明的异常数据,只能用统计学的准则决定取舍。用统计学的方法决定异常数据的取舍,其基本思想是:数值超过某一界限的测定值(或残差)出现的概率很小,是个小概率事件。如果在一个容量不大的测量列中居然出现了这种测定值,则有理由认为,这是由过失误差引起的异常数据,因而予以舍弃。对异常数据,除了设法从测量结果中发现、判断和鉴别而加以剔除外,更重要的是要加强测量工作者的工作责任心和以严格的科学态度对待测量工作:此外还要保证测量条件的稳定,应避免在外界条件发生激烈变化时进行测量
什么是异常数据?如何处理异常数据? 在一个测量列中,可能出现个别过大或过小的测定值,其数值明显偏离其余观测值,这 种包含巨大误差的测定值,通常称为异常数据。 异常数据往往是由过失误差引起的,也可能是由巨大的随机误差引起的。 在重复试验过程中,得到一系列测量值,如果混杂有异常数据,则必然会歪曲测量结果, 造成极大的误差。因此,必须在各个测量值中找出异常数据,并舍弃之,直到无异常数据时, 才可进行有关的数据处理而得到正确的结果。 异常数据的取舍必须十分慎重。如果有充分的根据可以判定异常数据是由过失误差引起 的,则应予舍弃。但严格说来,原始数据必须实事求是地记录,并注明有关情况,在整理数 据时,再舍弃上述有明显错误的数据。对于原因不明的异常数据,只能用统计学的准则决定 取舍。 用统计学的方法决定异常数据的取舍,其基本思想是:数值超过某一界限的测定值(或 残差)出现的概率很小,是个小概率事件。如果在一个容量不大的测量列中居然出现了这种 测定值,则有理由认为,这是由过失误差引起的异常数据,因而予以舍弃。 对异常数据,除了设法从测量结果中发现、判断和鉴别而加以剔除外,更重要的是要加 强测量工作者的工作责任心和以严格的科学态度对待测量工作;此外还要保证测量条件的稳 定,应避免在外界条件发生激烈变化时进行测量