小菜鸟河北联通上岗培训随笔二
今天是中国联通入职培训的第 7 天,还记得自己在第二天晚上写了自己初入培训中心的总结,后面三天的是职场礼仪,包括沟通呈现,职业心态和思维模式。本来想着等这三天的课程都讲完了再总结一下,发现自己拖着拖着就没时间写了,后面还有新的内容等着总结。所以以后给自己的总结是必须==当日事当日毕,坚决不拖沓!!!==
@[toc]今天白天主要学习到了联通的数字化技术和一些 linux 等网络知识。让我对大学的计算机知识有了进一步的了解和应用。晚上主要了解了 DISC 测评。让我对自己的性格有了进一步的认知,可以在以后的职场中更好地与他人沟通和交流。
联通的五大赛道为“大联接、大计算、大数据、大应用、大安全”。
在应用中涉及到的技术有数据中台,机器学习,云计算,数据挖掘与分析和网络空间安全。
大数据基础
大数据的本质
大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
(1)数据的存储:分布式文件系统(分布式存储)-----> HDFS: Hadoop Distributed File System (2)数据的计算:分布式计算
大数据的特点
可以使用 5 个字来概括:大、多、值、快、信
数据分析的前提是有数据,数据存储的目的是支撑数据分析。究竟怎么去存储庞大的数据量,是开展数据分析的企业在当下面临的一个问题。传统的数据存储模式存储容量是有大小限制或者空间局限限制的,怎么去设计出一个可以支撑大量数据的存储方案是开展数据分析的首要前提。
联通提出了高并发,实时性,海量数据分析处理思路,帮助用户和企业更好地使用云上资源。
数据中台
数据中台在数字化能力规划图中的定位:以数据中台为心脏,以数据为血液。
数据中台实现全域数据一点采集整合,提供统一数据服务视图数据/模型/算法/标签管理各个场景,通过数据赋能智慧运营。
以四大中台为载体,推动数据要素流入企业生产。
当前宽带运营服务的主要痛点包括流程断点多、运营效率低、成本高等。想要打造高效、有价值的数字化运营服务体系,从实践经验来看,关键在于“流程数字化”和“数据的挖掘与应用”,从而实现运营服务的决策和实施。中国联通构建的宽带数字化运营体系,将运营从基于经验转变为基于数据洞察,从单向的任务指派和执行转变为利用数据与流程赋能一线数字化作战,实现数据沉淀、模型分析、一线赋能的数字化运营闭环。
数据中台在中国联通的作用有很多,包括反欺诈,智慧到家,客户体验管理,客服工单智能定责,人力资源效能分析,价值管理。网络发展驾驶舱等等
机器学习
在大学中参加了很多数学建模比赛基本上也用到了机器学习。使用的一些方法例如回归分析,分类分析,聚类分析,蚁群算法,模拟退火算法。
机器学习可以分类为监督学习和非监督学习
一、监督学习
(1)支持向量机(Support Vector Machine,SVM):是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。例如,在纸上有两类线性可分的点,支持向量机会寻找一条直线将这两类点区分开来,并且与这些点的距离都尽可能远。
优点:泛化错误率低,结果易解释。
缺点:对大规模训练样本难以实施,解决多分类问题存在困难,对参数调节和核函数的选择敏感。
应用场景:文本分类、人像识别、医学诊断等。
(2)决策树(Decision Tree):是一个预测模型,代表的是对象属性与对象值之间的一种映射关系。
优点:易于理解和解释,可以可视化分析,容易提取出规则;能够处理不相关的特征。
缺点:对缺失数据处理比较困难。
应用场景:在决策过程应用较多。
二、非监督学习
(1)主成分分析(Principal Component Analysis,PCA):是一种统计方法。其主要思想是将 n 维特征映射到 k 维上,这 k 维是全新的正交特征也被称为主成分,是在原有 n 维特征的基础上重新构造出来的 k 维特征。
优点:降低数据的复杂性,识别最重要的多个特征。
缺点:主成分各个特征维度的含义具有一定的模糊性,不如原始样本特征的解释性强;有可能损失有用的信息。
应用场景:语音、图像、通信的分析处理。
数据库
1,数据库系统的四个基本概念
数据:data 数据库:DataBase,简称 DB 数据库管理系统:DataBase Management System,简称 DBMS 数据库系统:DataBase System,简称 DBS
2,数据库系统的特点
2.1,数据结构化
数据库系统与文件系统的主要区别之一
2.2,数据的共享性高,冗余度低且易扩充
2.3,数据独立性高
数据独立性包括物理独立性和逻辑独立性物理独立性:用户的应用程序与数据库中的物理数据存储是相互独立的逻辑独立性:用户的应用程序与数据库得逻辑结构是相互独立的
2.4,数据由数据库管理系统统一管理和控制
①数据的安全性防护:保护数据防止不合法使用造成的数据泄密和破坏②数据的完整性检查:保证数据的正确性有效性和相容性
3,数据模型
3.1,两种数据模型
第一类:概念模型,也称信息模型,主要用于数据库设计第二类:逻辑模型和物理模型,逻辑模型主要包括层次模型,网状模型,关系模型等等,主要用于数据库管理系统的实现,物理模型是对数据最底层的抽象
3.2 信息世界基本概念
(1)实体:客观存在并且相互区别的实物成为实体,例如一位学生,一位教师(2)属性:实体所具有的某一特性称为属性,例如学生实体的学号,姓名,出生日期(3)码:唯一标识实体的属性集(4)实体型:用实体名及其属性集合来抽象和刻画同类实体(5)联系:实体之间的联系通常是指不同实体集之间的联系
3.3,逻辑模型中比较重要的关系模型
关系:一个关系对应通常说的一张表元组:表中的一行即为一个元组属性:表中的一列即为一个属性码 : 可以唯一确定一个元组域 :一组具有相同数据类型的值得集合,例如大学生的年龄的属性的域(12~45 岁)分量:元组中的一个属性值关系模式:一般表示为:关系名(属性 1,属性 2,属性 3,...)例如:学生(学号,姓名,班级,出生年月)
4,数据库系统的三级模式结构
数据库系统的三级模式是指数据库系统由外模式,模式,内模式三级构成。
4.1 模式
模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图,是数据库系统的中间层,一个数据库只有一个模式
4.2 外模式
外模式也称子模式或用户模式,是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图
4.3 内模式
内模式也称存储模式,一个数据库只有一个内模式,它是数据物理结构和存储方式的描述 5,数据库的二级映像功能与数据独立性
网络(空间)安全
没有网络安全就没有国家安全。
当前,网络空间已经成为继陆、海、空、天之后的第五大国家主权领域空间,也是国际战略在网络社会领域的演进,我国的网络安全正面临着严峻挑战。以“没有网络安全就没有国家安全”“安全是发展的前提,发展是安全的保障”为宗旨,按照国家网络安全法律法规、战略要求,推广安全可信产品和服务,筑牢网络安全底线是历史的使命。
我国定义信息安全为:计算机信息系统的安全保护,应当保障计算机及其相关的配套设备、设施(含网络)的安全,运行环境的安全,保障信息的安全,保障计算机功能的正常发挥,以维护计算机信息系统安全运行。
网络安全是指利用计算机网络管理控制和技术措施,保证网络系统及数据的保密性、完整性、网络服务可用性和可审查性受到保护。
狭义上,网络安全是指计算机及其网络系统资源和信息资源不受有害因素的威胁和危害。广义上,凡是涉及到计算机网络信息安全属性特征(保密性、完整性、可用性、可控性、可审查性)的相关技术和理论,都是网络安全的研究领域。
网络安全问题包括两方面内容,一是网络的系统安全,二是网络的信息安全,而网络安全的最终目标和关键是保护网络的信息(数据)安全。
linux 知识点总结
Liunx 没有盘符的概念,只有一个根目录
pwd
:查看当前目录ls
:查看当前目录下的文件cd
:打开某个目录,切换操作路径cd ..
:打开上一级目录方向键上下
:上:取得上一行命令,下:取得下一行命令clear
:清空整个目录ls -l
:以列表形式打开文件目录ls -a
:打开隐藏文件目录ls .*od
t:找到以 txt 结尾的文件ls 1*
:找到以 1 开业的文件ls 1*.odt
:找到在 1 和.odt 中间有任意个字符的文件ls ?.odt
:找到任意以一个字符组成的 odt 文件ls [1234].odt
:找到 1.odt 或 2.odt 或 3.odt 或 4.odt 中符合要求的ls[1-5].odt
:找到 1.odt 或 2.odt 或 3.odt 或 4.odt 或 5.odt 中符合要求的
总结
通信行业是典型的技术创造需求,科技驱动发展的行业,中国联通应不断用技术驱动创新,把边界不断做大。更好地服务人民。2022 年 8 月 15 日 00:19:51 于石家庄
版权声明: 本文为 InfoQ 作者【乌龟哥哥】的原创文章。
原文链接:【http://xie.infoq.cn/article/d7d10066709eec601ae01cc3a】。文章转载请联系作者。
评论