族谱网 头条 人物百科

数据可视化

2017-10-16
出处:族谱网
作者:阿族小谱
浏览:531
转发:0
评论:0
概述数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是,这并不就意味着,数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。为了有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。然而,设计人员往往并不能很好地把握设计与功能之间的平衡,从而创造出华而不实的数据可视化形式,无法达到其主要目的,也就是传达与沟通信息。数据可视化与信息图形、信息可视化、科学可视化以及统计图形密切相关。当前,在研究、教学和开发领域,数据可视化乃是一个极为活跃而又关键的方面。“数据可视化”这条术语实现了成熟的科学可视化领域与较年轻的信息可视化领域的统一。历史法国工程师查尔斯·约瑟夫·密纳德(英语:CharlesJosephMinard)于1861年绘制的关于拿破仑入侵俄罗斯的信息图数...

概述

数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是,这 并不 就意味着,数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。为了有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。然而,设计人员往往并不能很好地把握设计与功能之间的平衡,从而创造出华而不实的数据可视化形式,无法达到其主要目的,也就是传达与沟通信息 。

数据可视化与信息图形、信息可视化、科学可视化以及统计图形密切相关。当前,在研究、教学和开发领域,数据可视化乃是一个极为活跃而又关键的方面。“ 数据可视化 ”这条术语实现了成熟的 科学可视化 领域与较年轻的 信息可视化 领域的统一 。

历史

数据可视化

法国工程师 查尔斯·约瑟夫·密纳德 ( 英语 : Charles Joseph Minard ) 于1861年绘制的关于拿破仑入侵俄罗斯的信息图

数据可视化领域的起源可以追溯到二十世纪50年代计算机图形学的早期。当时,人们利用计算机创建出了首批图形图表。1987年,由 布鲁斯·麦考梅克 ( 英语 : Bruce H. McCormick ) 、 汤姆斯·蒂凡提 ( 英语 : Thomas A. DeFanti ) 和 玛克辛·布朗 ( 英语 : Maxine D. Brown ) 所编写的美国国家科学基金会报告《 Visualization in Scientific Computing 》(意为“科学计算之中的可视化”) ,对于这一领域产生了大幅度的促进和刺激。这份报告之中强调了新的基于计算机的可视化技术方法的必要性。随着计算机运算能力的迅速提升,人们创建了规模越来越大,复杂程度越来越高的数值模型,从而造就了形形色色体积庞大的数值型数据集。同时,人们不但利用医学扫描仪和显微镜之类的数据采集设备产生大型的数据集,而且还利用可以保存文本、数值和多媒体信息的大型数据库来收集数据。因而,就需要高级的计算机图形学技术与方法来处理和可视化这些规模庞大的数据集 。

短语“ Visualization in Scientific Computing ”(意为“科学计算之中的可视化”)后来变成了“ Scientific Visualization ”(即“科学可视化”),而前者最初指的是作为科学计算之组成部分的可视化:也就是科学与工程实践当中对于计算机建模和模拟的运用。更近一些的时候,可视化也日益尤为关注数据,包括那些来自商业、财务、行政管理、数字媒体等方面的大型异质性数据集合。二十世纪90年代初期,人们发起了一个新的,称为“信息可视化”的研究领域,旨在为许多应用领域之中对于抽象的异质性数据集的分析工作提供支持。因此,目前人们正在逐渐接受这个同时涵盖科学可视化与信息可视化领域的新生术语“数据可视化” 。

自那时起,数据可视化就是一个处于不断演变之中的概念,其边界在不断地扩大;因而,最好是对其加以宽泛的定义。数据可视化指的是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。与立体建模之类的特殊技术方法相比,数据可视化所涵盖的技术方法要广泛得多 。

数据可视化的适用范围

数据可视化

北京地铁2015年规划图

数据可视化

手绘心智图

关于数据可视化的适用范围,目前存在着不同的划分方法。一个常见的关注焦点就是信息的呈现。例如,迈克尔·弗兰德利(2008)提出了数据可视化的两个主要的组成部分:统计图形和主题图 。另外,《 Data Visualization: Modern Approaches 》(意为“数据可视化:现代方法”,2007)一文则概括阐述了数据可视化的下列主题 :

思维导图

新闻的显示

数据的显示

连接的显示

网站的显示

文章与资源

工具与服务

所有这些主题全都与图形设计和信息表达密切相关。

另一方面,Frits H. Post(2002)则从计算机科学的视角,将这一领域划分为如下多个子领域 :

可视化算法与技术方法

立体可视化

信息可视化

多分辨率方法

建模技术方法

交互技术方法与体系架构

数据可视化的成功应归于其背后基本思想的完备性:依据数据及其内在模式和关系,利用计算机生成的图像来获得深入认识和知识。其第二个前提就是利用人类感觉系统的广阔带宽来操纵和解释错综复杂的过程、涉及不同学科领域的数据集以及来源多样的大型抽象数据集合的模拟。这些思想和概念极其重要,对于计算科学与工程方法学以及管理活动都有着精深而又广泛的影响。《 Data Visualization: The State of the Art 》(意为“数据可视化:尖端技术水平”)一书当中重点强调了各种应用领域与它们各自所特有的问题求解可视化技术方法之间的相互作用 。

相关领域

数据可视化

核医学成像:心脏 SPECT ( 英语 : SPECT ) 图像(短轴视图)与心脏三维模型的融合

数据可视化

利用2004年来自哈伯太空望远镜的照片以及地基图像所编制合成的螺旋星云可见光图像。

数据可视化

全球气温分布图

数据采集

数据采集(有时缩写为 DAQ 或 DAS ),又称为“数据获取”或“数据收集”,是指对现实世界进行采样,以便产生可供计算机处理的数据的过程。通常,数据采集过程之中包括为了获得所需信息,对于信号和波形进行采集并对它们加以处理的步骤。数据采集系统的组成组件当中包括用于将测量参数转换成为电信号的传感器,而这些电信号则是由数据采集硬件来负责获取的。

数据分析

数据分析是指为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析与数据挖掘密切相关,但数据挖掘往往倾向于关注较大型的数据集,较少侧重于推理,且常常采用的是最初为另外一种不同目的而采集的数据。在统计学领域,有些人将数据分析划分为描述性统计分析、探索性数据分析以及验证性数据分析;其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。

数据分析的类型包括:

探索性数据分析:是指为了形成值得假设的检验而对数据进行分析的一种方法,是对传统统计学假设检验手段的补充。该方法由美国著名统计学家约翰·图基命名。

定性数据分析:又称为“定性资料分析”、“定性研究”或者“质性研究资料分析”,是指对诸如词语、照片、观察结果之类的非数值型数据(或者说资料)的分析。

数据治理

数据治理涵盖为特定组织机构之数据创建协调一致的企业级视图( enterprise view )所需的人员、过程和技术;数据治理旨在:

增强决策制定过程中的一致性与信心

降低遭受监管罚款的风险

改善数据的安全性

最大限度地提高数据的创收潜力

指定信息品质责任

数据管理

数据管理,又称为“数据资源管理”,包括所有与管理作为有价值资源的数据相关的学科领域。对于数据管理,DAMA所提出的正式定义是:“数据资源管理是指用于正确管理企业或机构整个数据生命周期需求的体系架构、政策、规范和操作程序的制定和执行过程”。这项定义相当宽泛,涵盖了许多可能在技术上并不直接接触低层数据管理工作(如关系数据库管理)的职业。

数据挖掘

数据挖掘是指对大量数据加以分类整理并挑选出相关信息的过程。数据挖掘通常为商业智能组织和金融分析师所采用;不过,在科学领域,数据挖掘也越来越多地用于从现代实验与观察方法所产生的庞大数据集之中提取信息。

数据挖掘被描述为“从数据之中提取隐含的,先前未知的,潜在有用信息的非凡过程” ,以及“从大型数据集或数据库之中提取有用信息的科学” 。与企业资源规划相关的数据挖掘是指对大型交易数据集进行统计分析和逻辑分析,从中寻找可能有助于决策制定工作的模式的过程 。

延伸阅读

(英文) Chandrajit Bajaj, Bala Krishnamurthy (1999). "Data Visualization Techniques .

(英文) William S. Cleveland (1993). Visualizing Data . Hobart Press.

(英文) William S. Cleveland (1994). The Elements of Graphing Data . Hobart Press.

(英文) Alexander N. Gorban, Balázs Kégl and Andrey Zinovyev (2007). Principal Manifolds for Data Visualization and Dimension Reduction .

(英文) John P. Lee and Georges G. Grinstein (eds.) (1994).Database Issues for Data Visualization: IEEE Visualization "93 Workshop, San Diego.

(英文) Peter R. Keller and Mary Keller (1993). Visual Cues: Practical Data Visualization .

(英文) Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002).Data Visualization: The State of the Art.

外部链接

(英文) Milestones in the History of Thematic Cartography, Statistical Graphics, and Data Visualization, An illustrated chronology of innovations by Michael Friendly and Daniel J. Denis.

(英文) uiGarden.net - Weaving Usability and Cultures: Infographics: Being and Doing (Part I)by Venkatesh Rajamanickam (27 November 2007).

(英文) uiGarden.net - Weaving Usability and Cultures: Infographics: Being and Doing (Part II)by Venkatesh Rajamanickam (27 November 2007).

参见

计算机图形学

可视化


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱

更多文章

更多精彩文章
评论 {{commentTotal}} 文明上网理性发言,请遵守《新闻评论服务协议》
游客
发表评论
  • {{item.userName}} 举报

    {{item.content}}

    {{item.time}} {{item.replyListShow ? '收起' : '展开'}}评论 {{curReplyId == item.id ? '取消回复' : '回复'}}

    回复评论
加载更多评论
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回
打赏
私信

推荐阅读

· 可视化
可视化的领域计算机可视化是计算机图形学的一个子类别,关于处理的统计图形和地理或空间数据,它以示意图的方式表达抽象数据。科学可视化出于让信息/知识更容易被理解、传播和控制,将其用容易感知的方式进行呈现,包含但不仅限于视觉,听觉,嗅觉,触觉等等。教育可视化教育可视化通常是在计算机上创建一个模拟的图形来表示需要展示的物体。这是非常有用的,例如展示原子的结构,因为原子太小了,通过教育可视化很容易学习,且无需购买昂贵并难以使用的科学设备。产品可视化信息可视化数据可视化思维可视化参见信息图形学计算机图形学光学
· 科学可视化
概述美国计算机科学家布鲁斯·麦考梅克(英语:BruceH.McCormick)在其1987年关于科学可视化的定义之中,首次阐述了科学可视化的目标和范围:“利用计算机图形学来创建视觉图像,帮助人们理解科学技术概念或结果的那些错综复杂而又往往规模庞大的数字表现形式”。1982年2月,美国国家科学基金会在华盛顿召开了科学可视化技术的首次会议,会议认为“科学家不仅需要分析由计算机得出的计算数据,而且需要了解在计算过程中的数据变换,而这些都需要借助于计算机图形学以及图像处理技术”。此类数字体表现形式或数据集(英语:Dataset)可能会是液体流型(英语:Fluiddynamics)或分子动力学之类计算机模拟的输出,或者经验数据(如利用地理学、气象学或天体物理学设备所获得的记录)。就医学数据(CT、MRI、PET等),常常听说的一条术语就是“医学可视化(英语:Medicalimaging)”。科学可视...
· 国际数据
批评许多IDC的报告和预测由于方法的缺陷而受到批评,著名案例包括:预测英特尔安腾架构的销售预测WindowsPhone的市场份额竞争对手阿伯丁集团ABIResearchBurtonGroupCanalysDittbernerAssociatesForresterResearchFrost&Sullivan高德纳咨询公司GfKJupiterResearchTechnologyEvaluationCentersTekPlusThe451GroupWirelessFederationYankeeGroup
· 大数据
定义大数据由巨型数据集(英语:Dataset)组成,这些数据集大小常超出人类在可接受时间下的收集(英语:dataacquisition)、庋用(英语:datacuration)、管理和处理能力。大数据的大小经常改变,截至2012年(2012-Missingrequiredparameter1=month!),单一数据集的大小从数太字节(TB)至数十兆亿字节(PB)不等。在一份2001年的研究与相关的演讲中,麦塔集团(METAGroup,现为高德纳)分析员道格·莱尼(DougLaney)指出数据增长的挑战和机遇有三个方向:量(Volume,数据大小)、速(Velocity,数据输入输出的速度)与多变(Variety,多样性),合称“3V”或“3Vs”。高德纳与现在大部分大数据产业中的公司,都继续使用3V来描述大数据。高德纳于2012年修改对大数据的定义:“大数据是大量、高速、及/或多变的信息...
· 数据传输
协议分层与子条目在数据传输领域的课程与教材中,通常使用如下的OSI模型处理协议分层与主题:第一层,物理层:第二层,数据链路层:第六层,表示层:应用及历史基带或通带传输串行与并行传输通讯信道类型异步与同步数据传输参见计算机网络信息论Media(communication)信号处理电信Transmission

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信