学习总结 -- Week 8
本周主要讲算法,通信协议及数据库原理。对我个人来说,一下章节值得关注。
算法
遗传算法
遗传算法(英语:genetic algorithm (GA) )是计算数学中用于解决最优化的搜索算法,是进化算法的一种。 --维基百科
遗传算法是从代表问题可能潜在的解集的一个种群(population)开始的,而一个种群则由经过基因(gene)编码的一定数目的个体(individual)组成。每个个体实际上是染色体(chromosome)带有特征的实体。
染色体作为遗传物质的主要载体,即多个基因的集合,其内部表现(即基因型)是某种基因组合,它决定了个体的形状的外部表现,如黑头发的特征是由染色体中控制这一特征的某种基因组合决定的。因此,在一开始需要实现从表现型到基因型的映射即编码工作。由于仿照基因编码的工作很复杂,我们往往进行简化,如二进制编码。
初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代(generation)演化产生出越来越好的近似解,在每一代,根据问题域中个体的适应度(fitness)大小选择(selection)个体,并借助于自然遗传学的遗传算子(genetic operators)进行组合交叉(crossover)和变异(mutation),产生出代表新的解集的种群。
这个过程将导致种群像自然进化一样的后生代种群比前代更加适应于环境,末代种群中的最优个体经过解码(decoding),可以作为问题近似最优解。
出处:https://www.jianshu.com/p/ae5157c26af9
数据库优化
索引原理
查询数据表时,如果没有索引,每次都需要进行一次全表扫描,以确定有哪些行是匹配检索条件的。可以预见,当数据表内的数据量很大时,每次查询都会非常耗时。为了提高查询性能,可以将常被用于检索的列的值分类,进行重新组织,当通过值进行查询时,可以快速的找到对应的记录。
通常,数据库的索引都是用 B+树 来存储索引数据,因为 B+树能保证对任意数据的查询耗时是一致的。但是,相对来说,也意味着更新索引数据是一个比较耗时的操作。
索引类型
a. 聚簇索引:数据表的主键就是聚簇索引,且是唯一的聚簇索引。这是由聚簇索引的数据结构特性决定的。
b. 非聚簇索引:即聚簇索引之外的所有类型的索引。常见的有普通索引,联合索引,函数索引等。
查询优化
建立适当的索引可以优化查询速度。但是在有索引的表上插入新数据或者更新数据时,会引起索引重建过程,这是很耗时的操作。因此,有些情况下,优化的结果反而是去除不必要的索引。
评论