新技术(二)大数据与移动互联网
上一节课程中,我们学习到了 物联网 相关的知识以及看到了很多已经出现在我们生活中的 物联网 应用。而今天的内容呢,其实也和我们的生活有非常紧密的关系。头条为什么能一直推荐你喜欢的新闻?网易云音乐为什么让很多人奉为神器?抖音为什么会让你刷得停不下来?这些都是大数据和 AI 算法在背后做着各种推荐计算。如果说这些 APP 有一些商业成分存在,想要榨干我们的精力的话,那么智能信号灯、智能交通调度、国家天网系统、防疫二维码、大数据征信风控等等,则是大数据和 AI 在社会建设方面的优秀案例。总之,就像 互联网 已经渗透各行各业一样,大数据和 AI 也已经在各行各业中遍地开花。
大数据
大数据,从名字就能看出来,肯定数据量很大咯?这只是一方面。大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据有 5 个特点(5V):
- Volume:大量的,通常我们的 MySQL 数据库到达千万级别的表都是大表了,但是在大数据系统中,千万级别的数据日志是不值得引入大数据系统的。
- Variety:数据类型繁多,不仅限于文本、日志,现在的系统包括图形识别、影像分析等都已经是大数据和 AI 系统的主力应用了。
- Value:价值。通过 ETL 在大量繁杂的数据中提取有价值的内容,是大数据的核心。
- Velocity:处理速度快。MySQL 千万级的数据如果没有好的索引性能就会很惨了,而大数据相关的数据库如 HBase 、ClickHouse 之类的列式数据库则是游刃有余,至于计算平台就更不用说了。
- Veracity:真实痕迹。通常我们需要分析的数据都是来源于各种各样的信息系统、终端设备的用户行为痕迹。
我没做过大数据方面的开发,但是 Hadoop、HBase、Spark 的大名还是听说过的,没事也自己搭过玩过,Google 大数据的三驾马车通过开源的方式让全世界为之一震。通过分布式的计算和存储能力,让大数据的快速分析变成了现实,甚至还有不少可以实现实时计算的框架,可以预见大数据发展的兴旺势头。所有的头部互联网公司,没有一个是不做大数据的,包括国家也在充分利用大数据的各种优势来实现之前说所的各种惠民工程。
不过,大数据同时也会带来一些问题,比如个人隐私的问题。一个听歌的或者一个拍照的 App 为啥非要通讯录的权限?细思极恐。关注隐私保护、防范大数据诈骗和大数据犯罪行为也是我们所有 IT 从业人员的职业操守。
人工智能 AI
人工智能(Artificial Intelligence)是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
说到人工智能就不得不提到大数据,为什么呢?我们现在还处在比较初级的人工智能阶段,通过 机器学习 来训练计算机对一些数据进行反馈,以获得类似于人脑的结果,比如我们在文章顶部说过的 智能推荐 。其实就是根据你使用 App 的行为和各种来源的数据,分析你可能会喜欢的内容,当你浏览或者点赞了相关的内容,就会为你在这个类型的内容上多加一分。这些,都需要有大数据做为支撑才可以实现。当然,具体的实现远没有我说的这么轻松,但道理却是差不多的。
其实人工智能的很多算法在很早以前就有了,只是当时还没有完善的大数据系统。因此,当 Google 的大数据框架诞生后,AI 也迎来了黄金时期,跟随着大数据不断地蓬勃发展。并且,AI 也是我们面向未来的一个技术,《我,机器人》、《黑客帝国》、《终结者》都是我们对机械智能的幻想憧憬。虽说都是有点偏灾难性质的吧,不过电影总是这样才能有剧情吸引力嘛!真正对于现实的 AI 来说,未来还是应该抱有更美好的期待的。
移动互联网
其实我觉得,移动互联网真正兴起并且蓬勃发展还是在 3G 网络普及之后。当然,这里有点片面了,真正的移动互联网不只是包括 4G 、5G 这些的,还包括 WLAN 也就是 Wifi 网络,并且也不仅限于手机、平板,笔记本电脑、POS机等各种可以在移动状态下(如室外、高铁、公交)上使用互联网资源的形式都是移动互联网。
为什么说 3G 是一个重要的节点,因为在 3G 时代,微博大放异彩,同时出现了一个 “碎片化时间” 这样一个名词。这也就成了移动互联网的一个显著的特点,除了这个特点之外,还有 接入移动性、生活相关性、终端多样性 这几个特性共同组成了移动互联网明显区别于传统互联网的特性。
在移动互联网时代,软件开发技术也产生了一些变化,似乎桌面时代从 C/S 到 B/S 的过度在移动终端上又走了回去,我们日常使用的更多的还是各种需要安装的 APP 。不过 小程序 也正在发力,SAP(单页面应用)的各种框架(Vue、React、Angular)也一直在蓬勃发展,B/S 应用也是未来可期的,毕竟在小程序的概念出现以后,每个 APP 实际上都可以马上变成一个浏览器实现自己的小程序应用。除此之外,十年前 Android 和 IOS 开发的火爆场面也是非常夸张的,就像前几年的大数据AI人才一样,工资高得看不懂。当然,现在早已降温了,但原生开发依然还是移动端的主力开发方式。
区块链
最后就是 区块链 ,信管师考试中一定会有一到两道选择题是最近最火的一些技术方面的,比如我当时考试的时候就有区块链相关的题目。至于现在最火的?无服务?低代码?Web3.0?我也不太清楚了,好像有些年月没有什么全网人尽皆知,大家纷纷种草的新技术概念了。
区块链起源于比特币,现在有币的人可都是有钱人了。从科技层面来看,区块链涉及数学、密码学、互联网和计算机编程等很多科学技术问题。从应用视角来看,简单来说,区块链是一个分布式的共享账本和数据库,具有去 中心化、不可篡改、全程留痕、可以追溯、集体维护、公开透明等特点。这些特点保证了区块链的“诚实”与“透明”,为区块链创造信任奠定基础。而区块链丰富的应用场景,基本上都基于区块链能够解决信息不对称问题,实现多个主体之间的协作信任与一致行动。
原来听过一个比较生动的解释,是通过一个“村民买牛”的故事来说明区块链到底是在干嘛,也不知道对不对:
在一个100人的村庄,张三向李四买了一头牛,向他支付1万元。过去,他要依靠中间人赵六,才能将自己的1万元转给李四。而有了区块链系统,张三可以直接将自己的1万元记到李四的账本上,同时交易信息会传到全村,也就是整个区块链系统,使其他98个人也能看到信息。由系统记录整个交易过程,具有可溯源优势,防止赵六账本丢失或李四不认账等问题。
和云计算类似,按使用范围区块链也有三种类型:
- 公有区块链(Public Block Chains):世界上任何个体或者团体都可以发送交易,且交易能够获得该区块链的有效确认,任何人都可以参与其共识过程。公有区块链是最早的区块链,也是应用最广泛的区块链,各大bitcoins系列的虚拟数字货币均基于公有区块链,世界上有且仅有一条该币种对应的区块链。
- 联合(行业)区块链(Consortium Block Chains):由某个群体内部指定多个预选的节点为记账人,每个块的生成由所有的预选节点共同决定(预选节点参与共识过程),其他接入节点可以参与交易,但不过问记账过程(本质上还是托管记账,只是变成分布式记账,预选节点的多少,如何决定每个块的记账者成为该区块链的主要风险点),其他任何人可以通过该区块链开放的API进行限定查询。
- 私有区块链(Private Block Chains):仅仅使用区块链的总账技术进行记账,可以是一个公司,也可以是个人,独享该区块链的写入权限,本链与其他的分布式存储方案没有太大区别。传统金融都是想实验尝试私有区块链,而公链的应用例如bitcoin已经工业化,私链的应用产品还在摸索当中
总结
今天的内容说实话,没什么太重点的,但是呢,往往又会有那么一两道题可能就跟这些东西有关,要说完全地去硬背吧,好像也没太大的必要。怎么说呢?当成是扩展知识吧,有兴趣的多了解一些,没兴趣的多看两遍大概知道这些 大数据啊、人工智能啊、区块链啊 是个什么东西就够了。
新一代信息技术相关的内容就是这些了,总体来说这一部分其实难度不高,各种概念其实我们现在的生活都比较接近,还是很好理解的。接下来我们要学习的又是一个非常枯燥、难受、头疼的部分了,那就是 信息系统安全技术 相关的内容了。别说在座各位了,这部分我都有点发怵,但是,反过来说,这些知识多少会对你的工作生活有一些帮助,还是非常值得学习的,那么我们就一起加油吧!
参考资料:
《信息系统项目管理师教程》
《某机构培训资料》