Newswire
Newswire
Newswire 登入
Newsletter|Newswire Newsletter 联络我们|Newswire 联络我们 登广告|Newswire 登广告 关于我们|Newswire 关于我们 活动|Newswire 活动

ADVERTISEMENT

ADVERTISEMENT

资料收集

人类的求知欲是演化过程中重要的生存本能,即便现在生存压力减少,面对各类未知仍充满好奇。打破未知需要资讯,而资讯,既能作为历史记录,又能协助当下判断,更能预测未来。 如今,生活在资讯爆炸的年代,资讯唾手可得,却也附带问题:来源是否可靠?资讯从何而来?谁在负责统计、收集与记录? 报道:本刊 辜嘉荣 摄影:本报 苏思旗 每当大选临近,各类民意调查相关新闻相应而生。人民意向成为选情预测,间接满足人们探知未来的欲望。自媒体时代更是人人都能提问、搜集意见以及制作民调,只是,民调平台那么多,我们要如何筛选和判断一份民调是否适用与精准?民调结论对我们又有什么作用? 说到民调,不得不提我国成立已久的“默迪卡民调中心”(Merdeka Center for Opinion Research)。多年来,通过他们的民调资料我们了解选民生态,但我们却鲜少了解默迪卡民调中心的运作以及成立的故事。 自2003年营运以来,默迪卡民调中心除了发布免费公开给媒体和大众参考的政治民调,还进行由政府单位和私人企业委托的商业、经济和社会民调。这些调查将现有资讯统计和整合,为企业与政府提供决策参考,并成为其策略调整的重要依据。 默迪卡民调中心高级研究经理陈承杰解释,“1998年,亚洲金融风暴与网络双双来袭,民众开始好奇整体社会正在发生什么。然而当时民调多由大学单位进行,报告也相对学术,亦较少公开给民众查看。 “但是我们认为民调是一个国家民主化转型重要的角色,我们的目的是想做一个能与民众分享的民调机构,默迪卡民调中心因此成立。” 影响民调结果的软硬因素 2004年,默迪卡民调中心首份公开参考的民调主题为“全国选民调查要点:选民对国家大事、经济乐观情绪、犯罪与公共安全、伊斯兰教和政治参与的看法”,揭露选民对当时政经文教的满意度。 民调不只是提问及统计答案这么简单,而是需要根据当下的社会背景和议题,规划和设计问卷内容、调查对象和抽样方式,才能贴近真实民意。因此,民调机构内拥有来自各领域的专业人士,包括统计学、社会科学、政治学以及电脑科学等。 举例,2022年我国第十五届全国大选结果出炉之际,本报记者李佳憓整理了四所民调机构对选举成绩的预测:“4机构比一比-大选民调-默迪卡最准”,仅有默迪卡民调中心成功预测国盟成为第二多议席的联盟,也是整体预测准确度最高的民调机构。 即便针对相同议题,调查机制的设计依旧会影响最终结果。陈承杰认为,“民调除了抽样方式和问题设计,访问的硬体媒介和语言媒介、访问时间等因素都会影响最终结果。” 首先是访问硬体。面访始终是主要的访问方式,默迪卡民调中心还经历过打座机访问,再慢慢淘汰至以手机取代。如今虽然接触民众的通讯管道变多,但现代人却逐渐减少接听陌生来电,难免导致访问过程受阻。 被受访者拒绝更是常态,但他们自有应对方案。“让大众认识我们是谁很重要,他们才会愿意接受访问。也因此,透过媒体报道民调结果是我们宣传和扩大知名度的方式。” 时代越进步受访者越难接触? 如今,默迪卡民调中心亦开放民众申请担任线上民调小组成员,若符合特定民调的受访条件则会从中挑选采访。 “作为民调机构,我们需要熟悉采访对象的习惯,例如这个线上民调成员多是30岁以下的年轻人申请。随着年龄上升,受访者习惯的方式也逐渐转向电访、面访。虽然如此,但英国有一个民调机构YouGov,100%透过网络来进行问卷调查,结论也很精准。” 陈承杰透露,有时面访反而更能获得民众配合,愿意分享更多想法。不过,这也只是近年来的改变。在国阵独揽大权的年代,面访对受访者而言是一种压力,害怕公开表态(虽然民调不会公布受访者个人资讯)会引来打压。 “例如以前伯拉时代(前首相敦阿都拉巴达威),我们问民众觉得对首相的满意度如何,大家都说‘好话’。因此,伯拉的不满意度只有15%,但大选结果是反对党获得40%选票。我们就会发现有这种自我设限的心理因素,导致结果偏差很多。” 此外,采访媒介语亦是考量重点。默迪卡民调中心会因应受访者习惯的语言,而使用国语、华语、淡米尔语、英语,甚至方言以及东马土著的母语。 “民调也需要针对国情来作细微调整,比如选好调查时间。举例美国民调如果是周末时采访,基本就很难找到共和党支持者,可能都去教会了。在我国,周五中午时段你可能很难找到穆斯林受访、周日可能找不到基督徒。” 一份全国民调大约需要收集1200人的反馈,若只是选区则需要300至500人。因此一份民调大约耗时7至10个工作日来完成问卷收集的工作,再花上3至5天分析结果。 避免偏误,调查细节要做足 人的思维有许多盲点和偏误。举例,在战争期间,若发现派出的战斗机回来后,机翼和机尾有许多弹孔,你认为应该加强防御机身的什么部分?直观答案会选择加强机翼和机尾,但其实加强机身或许才是更优先的选择。机翼机尾被击中还能勉强返回,证明回不来的战斗机反而是因为机身受损而坠毁,这就是“幸存者偏误”。 到底为何看似无关紧要的细节会导致民调结果有偏差呢?民众自发在网络发起的问卷调查参与人数可能更多,怎么会不精准呢? 陈承杰坦言,如今的社交媒体演算法让我们看见的新闻、评论和内容是自己的“同温层”,难以发现与自己意见相左的帖文。虽然我们能自主在社媒平台成立投票问卷收集意见,但很多时候无法发现真正的民意。公允的民调才能让我们看见现况的真实舆论正关注什么议题、自己的意见又落在光谱的哪边,是让我们摆脱同温层的有效手段。 陈承杰解释,影响民调结果的关键其实是抽样方式以及问题设计。“若是有引导性问题,例如问卷答案都指向正面的答案,自然无法得出客观解读。” 抽样被质疑不公允怎么破? 至于抽样问题,“统计学上,作为社会科学的调查研究,我们只需要维持95%的置信水平(Confidence Level),以及3.1%左右的误差范围(Margin of Error)。” 置信水平指的是重复统计或抽样,会有多大概率获得真实民意。而误差范围则是统计结果有多少比例的误差可能。例如:95%置信水平和3.1%误差范围的民调显示A党有40%的支持率,那就代表这份民调有95%的概率包含真实民意,并且A党支持率大约是40%的正负3.1%。 需注意,受访者人数即便从1000人上调到2000人,误差范围并不会因此减半,因此,成本效益并不高。民调注重抽样方式反而才是能否展现民意的重点。例如在A党强势选区访问了2万人,也只会得到“A党支持率极高”的错觉,无法反映全国民意。陈承杰补充,“就连美国人口比我们多那么多倍,民调也只采样了1000人左右,甚至只采样摇摆州就能预测选举结果。” 判断抽样是否公允,民众可观察一份民调受访者的男女、族群、年龄比例是否符合真实分布比例。甚至可以更进一步观察是否涵盖不同教育水平、收入水平的受访者。 然而,对比其他国家,我国民调生态尚未成熟。陈承杰举例,“印尼国土大,理应移动成本会很高,实际上因为有多个据点和员工,所以整体开销反而更低。”各国的民调皆有其学习的特色,默迪卡民调中心是亚洲民主动态调查的研究成员之一,在民调问题设计讨论中与其他成员国交换意见。 陈承杰说,“参考其他国家,会发现民调机构多是自家媒体的其中一个单位,或跟媒体合作,民调机构生态才能健康发展。我们曾试过将数据转换成互动内容,也经营社媒平台,但制作时间和成本实在太高,无法长期投入。 “我们目前会持续与大学、媒体合作,招收实习生、上节目,让更多民众认识我们和民调这件事。” 相关稿件: 【资料收集/02】这些数据都不冷 大马统计局为国民提供生活脉动 【竞选团队/02】宣传手法与时并进 玩转竞选活动 【数据战争/01】被卖了还帮忙数钱?你的数据你自主  
5月前
通过民调除了能记录当下民众的意见,还需记录国内的活动资讯。马来西亚统计局(Department of Statistics Malaysia,DOSM)自1949年成立至今(旧称为统计处,Biro Statistik),是我国数据科学发展的开端。 有一个完整的资料库对国家和人民而言都很重要,但有什么作用?既然重要,为何统计局的资料如人口普查却并不是每年都收集呢? 报道:本刊 辜嘉荣 摄影:本报 蔡伟传 “资料就像国家的脉搏,为国民提供未来保障,也为政府提供决策参考。”大马统计局首席统计师拿督斯里莫哈末乌兹尔博士(Dato’ Sri Dr. Mohd Uzir Mahidin)说。 统计局担任着资料库的角色,将每年收集到的资讯统一、整合、储存,是我国数据治理的主要机构。该机构隶属于经济部,主要负责记录全国经济活动,如今年将开启2026年的经济普查。同时,他们也收集“社会”和“环境领域”相关统计,例如社会各阶层的收入分配、犯罪率、生育率、死亡率等,以及环境的可持续性、能源使用、自然灾害情报等。 数据领域虽看似只涵盖经济、社会和环境,但各领域底下覆盖范围却很完善。我国统计局在2024/2025年度的开放数据指数(Open Data Inventory,ODIN)中得分高达90分(满分为100分),在197个国家里排名第一。 2020年和2022年,我国仅徘徊在78名和67名,如今跃升至全球第一归功于“数据覆盖范围”得分从54分提高到79分、“数据公开程度”得分则从63分提高到99分,足见我国统计局在调查范围和调查结果都属于全球佼佼者。 数据在手,未来可预测 乌兹尔认为,统计数据的重点在于记录历史、了解当下,以及预测未来。“过去,在没有数据科学辅助的年代,当我们面对如大萧条这类型的经济衰退时束手无策,人民失去工作、失去生活方向却无从下手改善。如今若再面对经济衰退,我们至少还能迅速应对。 “70年代时,我国的贫困率大约49%,作为政府你要怎么改善民生呢?统计局提供政府一个了解我国国情的视角。当时我国经济活动多依赖农业,几乎没有工业发展。了解了这个现况后,政府就能从中着手,往工业市场开拓,增建工厂、增加外资、‘向东学习’,最终也成功转型。” 其次,资讯公开对决策者、居民和外来投资者都有辅助决策的功能。对政府而言,整合资讯才能了解现况,决策时才不会雾里看花。冠病疫情来袭正考验了国家数据的重要。当时行动管制令让工作停摆,零工经济人口收入更是严重受创。 “面对工作停摆,政府需要发放援助金予从事零工经济的国民,但到底有多少人、要发放多少钱呢?得益于统计局的资料,我们得知共有约200万人从事零工经济,这就能让政府精准帮助到需要的人。 “统计局整合资料的功能也成为一种信号灯,得知哪里有患者、哪里有灾情爆发,让前线人员能迅速反应。” 可是零工经济人口、贫困率这类宏观数据对普通百姓又有什么参考意义呢?对人民而言,数据也是日常起居不可或缺的一环。乌兹尔打个比方,“现在上司要将你从峇株巴辖调职到新山,你会跟上司要求增加多少额外津贴才足够呢?” 统计局设计的其中一个互动网站,“必要基础开销计算机”(Kalkulator Perbelanjaan Asas Kehidupan Wajar,MyPAKW)便有提供不同家庭人口、年龄、生活地区所需的开销预测。 透过计算,从峇株巴辖调职到新山,一家四口的开销将从4652令吉增至6368令吉。乌兹尔笑着说,“这时你就可以跟老板名正言顺地要求加薪啦!你也不会被老板搪塞自己,毕竟你有来自国家统计局的资讯。” 国家统计数据越透明,吸引外资潜力越强? 此外,统计局网页有一个“我的职业简介”(MyJobProfile)仪表板,提供各类职业的基本资讯,如中位数收入、平均收入、开放职位、基本工作内容等。“这让父母和孩子在考虑未来职涯和升学途径时,有更多的参考方向。” 乌兹尔类比公开数据宛如足球赛事的赛后资讯,能得知每一位选手究竟跑了多长距离、持球多久、对球队贡献有多少,所有细节都能针对性调整。 作为民众,我们看待一间公司就不仅从表面观察,也能看清该公司对环境可持续性是否有正面影响或造成威胁。“当一个产业背后的资讯透明化,我们就能得知它是否对环境造成污染、对周边居民造成什么影响,就能更全面地监督,避免危害自身的居住安全。” 从宏观角度来看,当一个国家的可公开资讯变得更透明,对外资而言便是信心来源。“比如标普全球评级(S&P Global Rating)会根据DOSM的数据进行国家评级(目前我国是A-等级,对未来展望是“稳定”等级)。 “一个国家的信用评级会影响外资以及国际货币基金组织、世界银行等对该国的投资期许和策略,进而影响国内经济发展。” 第三,掌握了现有资讯,我们也能预测未来。乌兹尔提问,“我们都知道要存钱,但你觉得要存到多少岁才足够呢?你觉得你还有多少年的预期寿命呢?”统计局的预期寿命计算网站能提供民众知晓我们在可预见的未来还有多少生命时长。 虽然影响生命时长的因素很多,至少能让个人对财务和健康管理有大致方向。然而对政府而言,政策制定就不能马虎,各类蓝图需要超前部署才能应对来临的威胁。 “例如我国即将迈入老龄化社会,而2059年我国人口将抵达顶峰(届时死亡人口将多于新生儿人数),预计将会有4200万人,接着就开始下降。政府总不能在2059年才处理这个问题,必须从长计议。 “要怎么改善呢?我们常听到少子化可能因为忙于工作赚钱,但高收入阶级生育率也并没有比较高呀。有了数据堆叠我们才能筛选理论,找出最符合我国国情的应对手段。” 与学术界合作推出互动工具,让数据融入生活 对于不同的经济活动,统计局会根据其特性归类成个别的细分项目,即马来西亚标准产业分类代码(Malaysia Standard Industry Cooperation,MSIC)。目前,我国共有1207个细分项目,让统计数据能精准对应各类经济活动。 单看“橡胶生产”领域,就细分成交通工具轮胎生产、手套、人造橡胶制作、橡胶再加工等。由于分类众多,无法单靠统计局现有人力进行所有的民调,需要民众配合普查。“例如今年将开始分阶段收集资料的2026年经济普查,主要让民众透过线上申报,先专注非正式领域,再逐步转向微型、小型、中型、大型企业。 “此外,因应城乡发展和地区限制,我们也会进行面访获得实时资讯。”这类型普查涉及人数众多,因此无法频密进行。“依据调查不同领域的趋势需求,我们发布的报告会分类为每个月、每一季度、每一年、每两年等类别。 “例如经济领域,我们在2025年每个月发布了外贸统计、消费者物价指数(CPI)等;每季度发布了国内生产总值、建筑统计等。即便不是每份报告都能年度产出,但透过每个月或每个季度的调查也能大致知晓其趋势。 “不是每项数据都由我们收集,例如会请皇家警察共享犯罪率等,但数据的完整度与便利是我们值得骄傲的特色。过去两三年间,共有接近20个国家来拜访交流。” 这些成就并不能仅依靠统计局完成,唯有民众配合提供数据、修改意见,才能让呈现效果更贴近需求。也因此,统计局于2017年起,决定在每年的10月20日庆祝“国家统计日”,让国民更注重数据素养。透过走入校园举办讲座、与大学签署合作备忘录、推出更多互动工具。“这才是将数据为己所用,让数据融入生活的体现。”   相关稿件: 【资料收集/01】大选越近民调越夯 默迪卡民调中心凭什么精准预测民意? 【数据战争/01】被卖了还帮忙数钱?你的数据你自主 【回避新闻/01】读者厌倦八卦新闻?数据新闻拯救资讯疲劳
5月前