A.数据(Data)和信息(Information)常识
一、牛津词典:数据
二、维基百科:数据
三、百度百科:数据
四、数据的一般概念
三、百度百科:数据
百度百科里,数据是一个多义词(共4个义项)▪计算机术语▪汉语词语▪综合性云数据平台▪杂志。其中,
①数据(汉语词语)[4],/shùjù/名词,数据就是数值,也就是我们通过观察、实验或计算得出的结果。数据有很多种,最简单的就是数字。进行计算、统计、科学研究、技术设计等所依据的数值。数据也可以是文字、图像、声音等。数据可以用于科学研究、设计、查证等。基本解释,指“[data]科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等的数值。提供各项数据。”;引证解释,指“指进行各种统计、计算、科学研究或技术设计等所依据的数值。柯岩《奇异的书简·船长》:“贝汉廷分析着各个不同的数据,寻找着规律,终于抓住了矛盾的牛鼻子。”
②数据(计算机术语)[5],数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。数据可以是连续的值,比如声音、图像,称为模拟数据。也可以是离散的,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元0,1的形式表示。释义:事实或观察的结果,性质:计算机术语,意义:信息的表现形式和载体。
3.1 定义(▪ 数据▪信息)
3.1.1 数据
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。它不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等,也是客观事物的属性、数量、位置及其相互关系的抽象表示。例如,“0、1、2...`”、“阴、雨、下降、气温”“学生的档案记录、货物的运输情况”等都是数据。数据经过加工后就成为信息。
在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号的介质的总称,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称。计算机存储和处理的对象十分广泛,表示这些对象的数据也随之变得越来越复杂。[6]
3.1.2 信息
百度百科里,信息指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。人通过获得、识别自然界和社会的不同信息来区别不同事物,得以认识和改造世界。(baike,2019) [7] 信息与数据既有联系,又有区别。数据是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。而信息是数据的内涵,信息是加载于数据之上,对数据作具有含义的解释。数据和信息是不可分离的,信息依赖数据来表达,数据则生动具体表达出信息。数据是符号,是物理性的,信息是对数据进行加工处理之后所得到的并对决策产生影响的数据,是逻辑性和观念性的;数据是信息的表现形式,信息是数据有意义的表示。数据是信息的表达、载体,信息是数据的内涵,是形与质的关系。数据本身没有意义,数据只有对实体行为产生影响时才成为信息。[8]
3.2 数据的语义
数据的表现形式还不能完全表达其内容,需要经过解释,数据和关于数据的解释是不可分的。例如,93是一个数据,可以是一个同学某门课的成绩,也可以是某个人的体重,还可以是计算机系2013级的学生人数。数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。
四、数据的一般概念
综上所述,数据的概念有三个视角:①观测的数值结果;②抽象字符记录;③信息的数字化表示。可以从两个维度来定义数据的概念:①数据(data)是指载荷或记录信息的、按一定规则表示的物理符号,可以是数字、符号、文字、图像、声音,也可以是计算机代码等等。②数据(data)是用于表示客观事物的未经加工的的原始素材,是人类对客观事物的逻辑归纳或观察结果。
4.1 数据与信息的关系
数据是信息的表现形式和载体,如符号、文字、数字、语音、图像、视频等。数据和信息是不可分离的。数据是信息的表达,信息是数据的内涵。数据本身没有意义,数据只有在对实体行为产生影响时才成为信息。数据的意义在于能够传递信息。对信息的接收,始于对数据的接收;对信息的获取,只能通过对数据背景的解读。数据背景是接收者针对特定数据的信息准备,即当接收者了解物理符号序列的规律,并知道每个符号和符号组合的指向性目标或含义时,便可以获得一组数据所载荷的信息。亦即数据转化为信息,可以用以下公式表示:数据+背景=信息。
4.2 计算机科学对数据的解释
数据(Data)指所有能输入到计算机并被计算机程序处理的符号介质的总称,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称,是组成信息系统的最基本要素。(国家标准GB/T36073-2018《数据管理能力成熟度评估模型》)[9]
在计算机系统中,数据以二进制信息单元0、1的形式表示,各种字母、数字符号的组合、语音、图形、图像等统称为数据;数据经过加工后就成为信息。
在计算机科学中,数据是指所有能输入到计算机并能被计算机程序处理的、具有一定意义的数字、字母、符号和模拟量等的通称。其中,模拟量是指变量在一定范围连续变化的量;也就是在一定范围(定义域)内可以取任意值(在值域内)。而数字量则是分立量而不是连续变化量,只能取几个分立值,如二进制数字变量只能取两个值。
未来是智能时代,社会单元的决策机制将发生巨大变化,谁最先拥抱数据化,谁就拥有更多智慧的土壤、就拥有更强竞争力。数据技术推动人类认知和人类社会生产生活质量快速提高,拥抱数据技术才是唯一选择。
未完待续(To Be Cont.)