如何做好数据分析?

先给大家讲一个数据分析的小故事,发生于四百年前。
在中世纪,科学界最大的争论在于,到底是地球围绕太阳旋转,还是太阳围绕地球旋转。那时候有一位伟大的天文学家叫第谷·布拉赫,为了解决这个人类科学最初的大争论,开始了寻求数据支持的伟大征程。当时丹麦国王专门为他建了一个天文台,配备了齐全的观测仪器。从那时之后的20年里,第谷每天晚上风雨无阻地观测行星运动的轨迹,把每个行星每天晚上的位置,精确地记录下来,是天文史上第一个真正地开始收集大数据的天文学家,但是他没有足够的智慧从中发现行星运行的规律。 后来,第谷的学生开普勒拿到大量的数据之后,摒弃了每一天的视角,他从每一年的视角来看:地球每365天就会回到原点,而其他的行星还在自己的轨道上运动。他把行星运动的轨道画出来了,得出了所有行星围绕太阳运动的结论。在此基础上,开普勒提出了著名的行星运动三大定律,成就了近代天文学的开端。
这个故事告诉我们:
1、数据是数据分析的基础。如果没有第谷20年如一日的观测记录,开普勒不可能取得如今的成就;而如果没有开普勒,第谷的所有观测数据,都将成为一堆毫无用处的废纸。
2、要客观的分析数据,具备数据分析的视角和思维。第谷一直以“地心说”的思想观察数据变化,开普勒接受了哥白尼的“日心说”思想,在新的角度上结合观测数据才发现行星运动的定律。
3、要学会合理利用数据。开普勒通过每年的观测数据,才发现了行星运动规律,当我们面对海量数据的时候,最需要的是独具慧眼,在繁杂的数据中找到我们需要的数据,才能真正的将数据运用起来。