第286章 快跑(1 / 2)

离语 semaphore 1866 字 14天前

数据是指对客观事件进行记录并可以鉴别的符号Y</p>

是对客观事物的性质状态以及相互关系等进行记</p>

载的物理符号或这些物理符号的组合Y是可识别的</p>

抽象的符号</p>

�6�1数据和信息是两个不同的概念Y信息是较为宏观</p>

的概念Y它由数据的有序排列组合而成Y传达给读</p>

者某个概念方法等Y而数据则是构成信息的基本单</p>

位Y离散的数据没有任何实用价值。</p>

数据也被称为“未来的石油”</p>

涉及到国家安全等方面。</p>

计算机系统中的数据组织形式主要有两种Y即文件和</p>

数据库</p>

�0�5</p>

1�0�6文件X计算机系统中的很多数据都是以文件形式</p>

存在的Y比如一个WORD文件一个文本文件一个</p>

网页文件一个图片文件等等</p>

�0�5</p>

2�0�6数据库X计算机系统中另一种非常重要的数据组</p>

织形式就是数据库Y数据库已经成为计算机软件开发</p>

的基础和核心。</p>

过去X一旦数据的基本用途实现了Y往往就会被</p>

删除Y一方面是由于过去的存储技术落后Y人们</p>

需要删除旧数据来存储新数据Y另一方面则是人</p>

们没有认识到数据的潜在价值</p>

现在X数据的价值不会因为不断被使用而削减Y</p>

反而会因为不断重组而产生更大的价值</p>

将来X各类收集来的数据都应当被尽可能长时间</p>

地保存下来Y同时也应当在一定条件下与全社会</p>

分享Y并产生价值。</p>

人类进入信息社会以后Y数据以自然方式增长Y其产生不以人</p>

的意志为转移</p>

从1986年开始到2010年的20年时间里Y全球数据的数量增长</p>

了100倍Y今后的数据量增长速度将更快Y我们正生活在一个</p>

数据爆炸的时代。</p>

数据分析过程包括X数据采集与预处理数据存储与管理数据处理与</p>

分析数据可视化等</p>

�0�5</p>

1�0�6数据采集与预处理X采用各种技术手段把外部各种数据源产生的数</p>

据实时或非实时地采集预处理并加以利用</p>

�0�5</p>

2�0�6数据存储与管理X利用计算机硬件和软件技术对数据进行有效的存</p>

储和应用的过程Y其目的在于充分有效地发挥数据的作用</p>

�0�5</p>

3�0�6数据处理与分析X数据分析是指用适当的分析方法�0�5来自统计学</p>

机器学习和数据挖掘等领域�0�6Y对收集来的数据进行分析Y提取有用信</p>

息和形成结论的过程</p>

�0�5</p>

4�0�6数据可视化X将数据集中的数据以图形图像形式表示Y并利用数据</p>

分析和开发工具发现其中未知信息的处理过程。</p>

数据采集与预处理包含了数据采集和数据预处理两大任务</p>

数据采集是指从传感器和智能设备企业在线系统企业离线</p>

系统社交网络和互联网平台等获取数据的过程需要采集的</p>

数据包括RFID数据传感器数据用户行为数据社交网络交</p>

互数据及移动互联网数据等各种类型的结构化半结构化及非</p>

结构化的海量数据</p>

数据采集技术是大数据技术的重要组成部分Y已经广泛应用于</p>

国民经济各个领域Y随着大数据技术的发展和普及Y大数据采</p>

集技术会迎来更加广阔的发展前景。</p>

数据预处理目标是为后续的数据分析工作提供可靠和高质量的</p>

数据Y减少数据集规模Y提高数据抽象程度和数据分析效率</p>