首页 > 数据可视化 > 可视化相关毕业设计学习路线图
2018
01-03

可视化相关毕业设计学习路线图

2017年末,我有幸带几位优秀的本科毕业生的毕业设计。正所谓术业有专攻,这几位同学的毕业设计题目都被我安排成了与我研究方向息息相关的内容,不仅有助于他们未来的学习工作,也对我个人的学术研究大有裨益。题目数据来源于2016年中国可视化与可视分析大会的挑战赛,该挑战赛提供了一系列精彩的剧本、翔实的数据和具体的问题,并邀请研究人员、开发人员和爱好者使用它们最有效的可视分析技术和工具来完成具体的数据分析任务,类似竞赛非常适合可视分析研究的入门与进阶实践(特别感谢中南大学赵颖教授的无私帮助)。

我的毕设题目的最终目标是制作一个可视分析软件,能够通过该软件的数据分析和可视化,说明数据中蕴含的特征规律和知识。不过,大多数本科生并未有数据可视化相关理论知识和足够的技术积累,因而利用好这个假期积攒足够的知识显得非常重要。本文将从可视化设计、数据分析、技术实现三个角度来阐述要学习的内容。

可视化设计

首先是可视化设计。可视化设计是指数据可视化过程中的表达方式,是我们最终设计的软件的灵魂。然而这个灵魂不可能一开始就得到。需要我们在分析前人工作的基础上,通过不断模仿和摸索才能获得。具体的说,可分为如下几步进行:

  • 收集资料:从chinavis官网上收集所有挑战赛获奖作品、通过百度学术、知网等平台上下载相关论文。
  • 总结:写多篇竞品分析类文章:总结挑战赛获奖作品中所用的可视化设计、分析方法和采用的技术。这些可视化设计、分析方法和技术必须能找到对应的论文。
  • 提炼:以思维导图的形式归纳这几篇文章的核心内容。并得到:哪些可视化设计、分析方法和技术是必须的,哪些是可选的,哪些是可以改进的。
  • 分析探讨:将提炼出的结果,跟其他同学和老师进行探讨。从而形成设计方案。
  • 形成设计方案:将设计方案,用图片+文字的方式加以描述。

数据分析

然而可视化设计不能独自进行,在总结、提炼、分析探讨的过程中,必须不断地与数据分析过程结合,从而验证方法的有效性。数据分析与可视分析通常是循环进行,互为补充,具体分为如下几个步骤:

  • 收集资料:从chinavis官网上下载数据集,以及从其他数据源上获取数据。
  • 数据概览:要从数据集的描述信息中了解大致内容(例如,字段的大致内容和数据类型,表之间的关联关系等)然后确保可以通过商业数据可视化软件如tableau、Excel、Gephi、cytoscape将之打开。
  • 经典复现:试着用商业数据可视化软件复现获奖作品和经典论文中的可视化设计。从而确认
  • 哪些可视化设计、分析方法和技术是必须的,哪些是可选的,哪些是可以改进的。
  • 摸索试错:尝试用依赖自己的想法,使用商业数据可视化软件展示数据中的规律。从而帮助形成可视化设计方案。
  • 实践检验:把最后实现的可视分析软件,套用真实数据进行检验,确保其有可用性。

技术实现

为了支撑以上的可视化设计与数据分析,还需要学生掌握一些基础技术。这些基础技术包含两大类,其一是商业可视化软件的使用,这个比较简单,要求2周内可以实现示例(例如tableau可以轻松地用它是现实教程示例)。其二是web开发技术。这个比较复杂。每个同学的侧重点各有不同:

  1. 编程能力比较好的同学:直接实现web应用的基础框架。通过这个基础框架实现一个API,该API可以从数据库读取数据,然后封装成Json格式发送到前端即可。API的设计风格建议restful。至于具体采用什么技术栈,看自己的特长而定。
  2. 对于编程能力比较弱的同学:先学习web前端基础,要求必须学会使用HTML/CSS/JQuery和Bootstrap构建网页。为了保证学习进度和成效,推荐去Github上追这个最火的编程学习项目:freecodecamp.cn 。这个项目课程设置得很平滑,既有循序渐进的基础知识,又有自由发挥的小项目,一边实践一边学习,更打游戏闯关一样的体验,比看教学视频、w3cshool之类强的多。

此外,所有同学都要学习前端数据可视化编程的知识,具体的说就是要掌握百度echarts类库的实现一般可视化图例的方法,和使用D3js类库实现自定义可视化图例的方法。对于某些选择了特殊题目的同学来说,webGL的threejs类库也是必须了解的。

考虑到本题目相对于要学习的内容较多,因此定时的知识总结和强力的工作监督必不可少。故而要求每个学生每周发表一篇博客,总结最近一周的工作,要求有图有真相。内容可以是最近学习的软件使用方法总结、技术开发总结、数据分析说明、可视化设计案例总结等等。老师我每周查看并回复问题和布置任务。此外,还需要每周电话联系一次。

祝大家通过这次合作,都能获得自己满意的结果。


留下一个回复

你的email不会被公开。