基于ArcGIS的群体特征分析

提到因子分析,大家一定会觉得这不是统计方法吗,跟ArcGIS有关系?没错,正是因为ArcGIS能够集成R语言,将R语言脚本封装成GP工具,所以在ArcMap或是ArcGIS Pro中使用各类花式统计方法是没有任何壁垒的。
(关于ArcGIS如何集成R语言,请参见:ArcGIS集成R语言解析



1 什么是因子分析?
因子分析是指研究从变量群中提取共性因子的统计方法。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
举个例子,如果一个班学生的数学、物理、化学、语文、英语、历史各科成绩作为一个个单独的因子的话,那么因子分析可以提取出一些共性因子。例如,与数学、物理、化学相关的维度可以代表学生的理科思维水平,而与语文、英语、历史相关的维度可以代表学生的文科思维水平。

2 案例介绍
本案例想要探究居民的旅行行为与居民的一些属性特征之间的关系。示例数据是中国某农村地区的202个居民点分布数据。下图中每一个点代表一个家庭的位置。并且,包括家庭的平均年龄、收入、拥有农田的面积、教育水平等。


下表是我们感兴趣的变量的含义:


接下来,我们利用封装R语言的GP工具,进行因子分析,研究变量间属于的维度和它们之间的关系。其中,将Gov_GTGP, Gov_GTGB,Cropland, Nbr_labor作为定量变量输入,将Tourism_pa作为定性变量输入。


运行GP工具之后,我们得到以下结果:
1)变量图

结果表明:Gov_GTGP与第二个维度有强相关,Cropland和Tourism_pa与第一维度有中到高程度的相关。


2)定量变量图


结果表明:
• GTGP项目的农田比例越低,那么家庭拥有的农田面积越大。
• 有旅行行为的家庭拥有的GTGP项目的农田比例小。
根据以上结论,我们可以猜测拥有GTGP项目的农田面积小的家庭,会少获得国家的补贴金。这是由于农民拥有更大面积的农田来耕种,不太需要国家补助,所以不倾向参加GTGP项目。另外,这样的家庭收入会更高,更有钱去进行旅行活动。

当然,因子分析还有更加广泛的应用。例如在商业中,因子分析可用来分析不同品牌的用户特征有何不同,从而进行更加有针对性的推广;在教育领域中,可用来分析不同学校、不同班级的学生特征,从而进行因材施教。而这些因子中如果加入地理位置相关的考量,那么我们就可以利用ArcGIS-R Bridge这个工具,在ArcGIS中实现从数据的预处理、到因子分析(封装R脚本的GP工具)、再到最后的可视化结果显示一整个工作流。

文章来源:https://mp.weixin.qq.com/s/rv_nj3PxqHMC6_DzFQP7Ug

0 个评论

要回复文章请先登录注册